Déduplication des données
Qu’est-ce que la déduplication des données ?
La déduplication des données est une technique qui minimise l’espace nécessaire au stockage des données. Elle est conçue pour aider les entreprises à résoudre le problème de la duplication des données. Qu’une entreprise accumule plusieurs copies d’un même fichier ou plusieurs fichiers contenant les mêmes données, la déduplication remplace les copies redondantes de données par des métadonnées qui renvoient simplement à l’original.
Comment fonctionne la déduplication des données ?
Il existe deux méthodes principales de déduplication : la déduplication en ligne et la déduplication post-traitement. Chacune est destinée à un type d’environnement de sauvegarde spécifique.
La déduplication en ligne analyse les données stockées dans un système de sauvegarde. Les redondances sont identifiées et supprimées au fur et à mesure que les données sont écrites dans ce système de stockage de sauvegarde. Cette méthode nécessite moins de stockage de sauvegarde mais peut engendrer des goulots d’étranglement ; il est donc recommandé de désactiver les outils de déduplication des données lors de l’exécution des fonctions de stockage primaire hautes performances.
La déduplication post-traitement supprime les données redondantes après leur écriture sur le stockage. Les données en double sont identifiées, supprimées et remplacées par un pointeur vers la première itération du bloc de données. L’approche post-traitement permet aux utilisateurs de dédupliquer des charges de travail spécifiques et de récupérer rapidement la sauvegarde la plus récente.
La déduplication post-traitement nécessite une plus grande capacité de stockage que la déduplication en ligne.
Pourquoi la déduplication des données est-elle nécessaire ?
La déduplication des données permet au département informatique de réduire non seulement les besoins en espace de stockage, mais aussi les coûts associés aux données dupliquées. Les grands jeux de données comportent souvent beaucoup de doublons, qui augmentent d’autant les coûts du stockage. Le gain d’espace obtenu grâce à la déduplication des données dépend du jeu de données ou de la charge de travail placés sur le volume. Pour les jeux de données à duplication élevée, le taux d’optimisation peut aller jusqu’à 95 %.
La déduplication des données permet également de réduire la quantité de bande passante gaspillée pour le transfert des données vers et depuis les sites de stockage distants. Enfin, la possibilité de gérer plus efficacement les ressources de stockage peut faire toute la différence pour vos capacités de sauvegarde :
· allocation efficace des ressources de stockage ;
· réduction des coûts ;
· optimisation du réseau ;
· efficacité du datacenter ;
· reprise rapide et continuité de l’activité.
HPE et la déduplication des données
Toutes les solutions de sauvegarde n’abordent pas la déduplication de la même manière. Apprenez à connaître votre infrastructure et vos besoins individuels en matière de sauvegarde. HPE peut vous aider à éliminer les incertitudes concernant l’optimisation des données avec une solution hybride qui équilibre les avantages de la déduplication des données axée à la fois sur la sauvegarde et sur la cible dans l’ensemble de votre environnement informatique. Découvrez la solution HPE InfoSight, qui fait bénéficier votre entreprise d’une expérience opérationnelle cloud en gérant les applications et les données de l’edge au cloud avec l’IA pour infrastructure la plus avancée du secteur, de sorte que votre environnement reste constamment actif, rapide et agile.