Data store
Cos’è un data store?
Un data store è un repository per l’archiviazione, la gestione e la distribuzione di set di dati.
Il termine comprende tutti i tipi di dati prodotti, utilizzati e archiviati da un’organizzazione.
Quali sono i diversi tipi di data store?
I tipi di data store più comuni sono i seguenti:
Database relazionale (RDB): è il tipo di data store più resistente e affidabile, costituisce lo standard di settore per lo storage attendibile. Un RDB organizza i dati in tabelle, ciascuna con uno schema che definisce le colonne della tabella; ciascuna riga, che rappresenta un record delle informazioni, deve essere conforme allo schema e avere un valore per ciascuna colonna. In sintesi, alle informazioni viene assegnato un valore di schema in modo tale che una relazione tra valore e informazioni venga stabilita e mantenuta .
Database non relazionali (NoSQL): un database che mantiene durabilità, resilienza, persistenza, replicabilità, distribuibilità e prestazioni senza applicare schemi o non applicandoli in modo rigoroso. I database NoSQL sono costituiti da due sottocategorie principali: document store e wide-column store.
· Document store: un archivio chiave-valore in cui la chiave non viene mai utilizzata. Il valore diventa un blob di dati semi-strutturati e il data store un enorme array di blob. Il linguaggio del document store consente all’utente di ordinare o filtrare i dati in base al contenuto individuato nei blob di documenti.
· Wide-column store (WCS): essenzialmente un document store ibrido e un RDB. Nonostante un WCS utilizzi tabelle, righe e colonne, i nomi e i formati delle colonne formano le righe in un’unica tabella.
Key-value store: una hashmap su scala di produzione (una hashmap è una mappa da chiavi a valori). Questo tipo di data store non ha elementi relazionali o non relazionali, solo chiavi e valori. È una valida soluzione per archiviare temporaneamente oggetti semplici.
Motore di ricerca full-text (FTSE): tecnicamente, gli FTSE sono data store NoSQL. Mentre i motori di ricerca sono ottimi per cercare e filtrare corrispondenze di testo e valori numeri esatti (i DB possono ottenere risultati analoghi), gli FTSE sono ideali per la ricerca di sottostringhe o parole in campi testo più lunghi.
Coda di messaggi: nonostante fossero state originariamente concepite per il trasferimento dati, le code di messaggi vantano prestazioni tanto affidabili quanto i primi tipi di data store. Una coda di messaggi può fungere da pseudo-key-value store, ma è meglio sfruttata per archiviare, accodare o inviare temporaneamente i dati.
Cosa include un data store?
Un data store può includere i dati dalle applicazioni di database degli utenti finali, dati casuali di un’organizzazione o di un sistema informativo, file o documenti. Può essere strutturato o meno ed è disponibile in diversi formati elettronici.
La classificazione del data store dipende dall’organizzazione. Un data store può essere classificato come centralizzato, operativo, o specifico di un’applicazione e può essere progettato e implementato utilizzando software appositamente realizzato o con una normale applicazione di database.
HPE e i data store
Un singolo data store è un’idea logica. Il modo migliore per eseguire un singolo data store è utilizzare una distribuzione logica. HPE Ezmeral è un’idea logica: una piattaforma aperta, un object store a prestazioni elevate, un database multimodale, un multi-tenant ibrido e un unico spazio nomi globale.
In un unico data store, HPE Ezmeral integra file, database NoSQL, oggetti e diversi tipi di dati in streaming dalle architetture cloud native e big data esistenti. Questo consente agli utenti di accelerare i tempi per ottenere le informazioni e proteggere la condivisione dei dati tra applicazioni e tool di analisi dati moderni e tradizionali.
Le topologie edge-to-cloud di HPE Ezmeral Data Fabric vengono create e sono accessibili tramite uno unico spazio dei nomi globale che semplifica l’accesso ai dati da qualsiasi applicazione, indipendentemente dall’interfaccia o dalla posizione dei dati. HPE Data Lakehouse è appositamente progettato non solo per eseguire grandi quantità di analisi di dati strutturati, ma anche per abbinare i vantaggi in termini di scalabilità e flessibilità di HPE Data Lake alla gestione dei dati e alle strutture del Data Warehouse.