Deduplicazione dei dati
Cos’è la deduplicazione dei dati?
La deduplicazione dei dati è una tecnica che riduce al minimo lo spazio necessario per l’archiviazione. È stata realizzata per consentire alle organizzazioni di risolvere il problema dei dati duplicati. Nel caso in cui l’azienda accumuli diverse copie dello stesso file o di più file che contengono gli stessi dati, la deduplicazione sostituisce le ulteriori copie dei dati con metadati che riportano semplicemente all’originale.
Come funziona la deduplicazione?
Esistono due metodi di deduplicazione principali: deduplicazione in linea e post-elaborazione. Sono destinati a diversi tipi di ambienti di backup.
La deduplicazione in linea analizza i dati in un sistema di backup. Le ridondanze sono identificate e rimosse durante la scrittura dei dati sullo storage di backup. Per questo richiede meno storage di backup ma può provocare un collo di bottiglia, è quindi consigliato disattivare i tool di deduplicazione dei dati durante le operazioni dello storage primario ad alte prestazioni.
La deduplicazione post-elaborazione rimuove i dati ridondanti dopo la loro scrittura nello storage. I dati duplicati vengono identificati, rimossi e sostituiti con un puntatore che indica la prima iterazione del blocco dati. L’approccio di post-elaborazione consente agli utenti di deduplicare carichi di lavoro specifici e ripristinare rapidamente il backup più recente.
La deduplicazione post-elaborazione richiede una maggiore capacità di storage rispetto a quella in linea.
Perché è necessaria la deduplicazione dei dati?
La deduplicazione dei dati consente ai reparti IT di ridurre non solo lo spazio di storage richiesto, ma anche i costi associati ai dati duplicati. I grandi set di dati contengono spesso molti duplicati, aumentando i costi di storage. I risparmi di spazio ottenuti dalla deduplicazione dei dati dipendono dal set di dati o dal carico di lavoro sul volume. I set di dati con elevata duplicazione possono raggiungere tassi di ottimizzazione del 95%.
La deduplicazione dei dati consente anche di ridurre la quantità di larghezza di banda sprecata durante il trasferimento dei dati da e verso le posizioni di storage remote. E la capacità di gestire in modo efficace le risorse di storage può fare molta differenza per quanto riguarda le funzionalità di backup:
· Allocazione efficiente dello storage
· Risparmi sui costi
· Ottimizzazione della rete
· Efficienza del data center
· Ripristino rapido e continuità
HPE e la deduplicazione dei dati
Non tutte le soluzioni di backup affrontano la deduplicazione allo stesso modo. Scopri la tua infrastruttura e i tuoi requisiti di backup. HPE è in grado di aiutarti a semplificare l’ottimizzazione dei dati attraverso una soluzione ibrida con il giusto equilibrio di vantaggi di deduplicazione dei dati incentrata su backup e obiettivi in tutto l’ambiente IT. Scopri di più su HPE InfoSight e in quale modo consente all’organizzazione di ottenere l’esperienza operativa cloud nella gestione di dati e applicazioni dall'edge al cloud con l’intelligenza artificiale per l’infrastruttura più avanzata del settore garantendo un ambiente sempre disponibile, veloce e agile.