Storage a oggetti e object store
Cos'è lo storage a oggetti e cosa sono gli object store?
Lo storage a oggetti è un sistema di gestione dello storage dati in unità dedicate, note come oggetti. Un object store è una piattaforma in cui il software di analisi dati può eseguire query sugli oggetti.
Con la sua capacità infinita, lo storage a oggetti un tempo era considerato un'opzione di archiviazione a costi contenuti per le funzioni di backup e ripristino. Con il passaggio degli sviluppatori al cloud e la crescita dell'analisi nelle aziende, i casi d'uso per s3 e lo storage a oggetti sono aumentati grazie alla capacità di gestire enormi volumi di dati e set di dati.
Come funziona lo storage a oggetti?
Lo storage a oggetti riunisce i blocchi di dati in un'unica unità e assegna un identificativo univoco con metadati avanzati a ciascun oggetto per semplificare la ricerca ovunque all'interno di un pool di dati distribuito, sia on-premise sia in più sistemi di rete e aree geografiche.
Lo storage a oggetti elimina la struttura gerarchica utilizzata da altri sistemi utilizzando uno spazio di indirizzi flat. In questo modo può scalare facilmente in orizzontale o in verticale, adattandosi a rapide espansioni e contrazioni al variare dei carichi di lavoro di storage.
Inoltre, per aggiornare i dati archiviati, i sistemi di storage a oggetti salvano nuove copie dell'intero asset e non solo le piccole porzioni modificate, allungando la durata di conservazione dei dati rispetto ad altri sistemi.
Purtroppo, un carico più pesante di metadati richiede un sovraccarico e rallenta i processi di modifica dei dati. Di conseguenza, lo storage a oggetti tradizionale era più adatto ai dati che necessitavano di un accesso meno frequente, per esempio:
- elaborazione di backup per il recupero degli archivi a seguito di una calamità o di una perdita di dati
- contenuti web statici, come foto, documenti storici, musica ecc.
- applicazioni che scrivono solo una volta o vengono lette e/o non aggiornate frequentemente
confronto tra storage a oggetti, storage a blocchi e storage di file
Lo storage dati è disponibile in tre categorie di modalità che rispondono alle esigenze di accesso in modo diverso: oggetto, blocco e file. Il metodo da scegliere dipende da diverse caratteristiche fondamentali in base ai casi d’uso.
Essendo il metodo di archiviazione dati più semplice e antico, lo storage basato su file inserisce i dati come un'unica informazione all'interno di una cartella, proprio come un sistema cartaceo: consentendo di accedere ai dati archiviati con un percorso semplice, si presta bene alla gestione di file condivisi. Tuttavia, a causa della sua struttura di archiviazione gerarchica, trovare una specifica informazione può risultare nella migliore delle ipotesi laborioso.
Lo storage basato su blocchi divide i dati in unità che possono essere distribuite in un sistema per maggiore efficienza. Lo storage a blocchi, tuttavia, limita i metadati assegnati a ogni blocco di dati a un indirizzo identificativo univoco. Per questo motivo, i blocchi non richiedono molto sovraccarico e risultano più agili ed efficienti di altri sistemi. Tale snellezza garantisce prestazioni estremamente elevate per i dati che cambiano frequentemente, come quelli transazionali.
Al contrario, lo storage a oggetti aggiunge molti più metadati a ogni file rispetto ad altri sistemi: può includere informazioni contestuali e personalizzabili, come dettagli dell'applicazione, livelli di protezione dei dati e ulteriori dettagli sulle policy di conservazione e altri attributi. In questo modo, gli utenti possono implementare un'ampia gamma di analisi su grandi quantità di dati non strutturati. Inoltre, lo storage a oggetti elimina la struttura gerarchica di altre modalità, consentendo una maggiore scalabilità e un accesso più ampiamente distribuito.
Come funziona lo storage a oggetti con Kubernetes?
Per comprendere come Kubernetes e lo storage a oggetti si incastrano tra loro, è importante comprendere che, fondamentalmente, la crescita dei dati determina l'obsolescenza delle tecnologie. Di conseguenza, il rapido e continuo aumento del volume di dati sta accelerando i cicli di sviluppo tecnologico a ritmi vertiginosi.
Progettato specificamente per gli ambienti in rapido cambiamento, Kubernetes è diventato una forza dominante nella gestione dell’infrastruttura di elaborazione, rete e storage. Come piattaforma predefinita per Kubernetes, lo storage a oggetti offre l'elasticità, la scalabilità e la resilienza necessarie alla piattaforma per potenziare il suo framework di creazione/archiviazione/implementazione. Utilizzando lo storage a oggetti, Kubernetes consente agli operatori di gestire qualsiasi aspetto, dal provisioning al posizionamento dei volumi su vasta scala e con sovraccarico ridotto.
E quando le applicazioni vengono eseguite in container, lo storage a oggetti ne mantiene lo stato. Questo è fondamentale per Kubernetes, perché richiede che lo storage a oggetti stesso venga eseguito nel container per gestire l'automazione dell'infrastruttura. Quindi, tramite lo storage a oggetti, Kubernetes è in grado di orchestrare l'infrastruttura in un ambiente stateless portatile.
Soluzioni per lo storage a oggetti HPE
Con l'espansione dei casi d'uso per lo storage a oggetti, HPE ha dovuto ampliare il numero di soluzioni proposte.
Le soluzioni HPE per Scality sono la soluzione preferita per lo storage a oggetti a uso generico, tra cui:
- alternativa on-premise allo storage su cloud pubblico, dalla scalabilità in orizzontale su larga scala fino a un nodo edge
- repository di dati multimediali e pronto per la condivisione
- storage di tier successivo per l'offloading dei dati, per esempio Splunk SmartStore, imaging medico e archivio HPC
- storage di destinazione del backup aziendale semplice
HPE Ezmeral Data Fabric è la soluzione preferita per i carichi di lavoro di analisi, IA e ML che richiedono prestazioni e scalabilità elevate. Alcuni esempi di questi casi d'uso includono analisi, ricerca, Internet of Things (IoT) e informazioni aziendali. HPE Ezmeral Data Fabric è la prima soluzione che consente di riunire file, oggetti, database NoSQL e flussi in un'unica infrastruttura dati e un solo file system in ambienti on-premise, multi-cloud ed edge, consentendo agli utenti e alle applicazioni di accedere direttamente ai dati attendibili, indipendentemente da dove risiedano.