Piattaforma dati cloud
Cos’è la piattaforma dati cloud?
Una piattaforma dati cloud è un data center che si trova sul cloud e include un server e uno storage dati. Fornisce l’accesso virtualizzato ai dati da più origini in diverse posizioni.
Qual è lo scopo di una piattaforma dati cloud?
Uno dei passaggi della trasformazione digitale delle aziende prevede la migrazione dell’ecosistema e dei dati aziendali al cloud dai tradizionali data center o warehouse on-premise. Una piattaforma dati cloud è il luogo in cui queste risorse vengono trasferite, consentendo alle imprese di creare un data lake accessibile ovunque e in qualsiasi momento. Questa “democratizzazione” consente una rapida acquisizione dei dati strutturati e non strutturati per supportare le analisi. La piattaforma può essere inoltre scalata rapidamente in base ai cambiamenti delle esigenze di analisi e dati.
Perché le imprese utilizzano una piattaforma dati cloud?
L’uso di una piattaforma dati cloud consente alle aziende di sfruttare i dati con maggiore facilità. Possono inoltre gestire, proteggere e visualizzare i dati da qualsiasi luogo, da remoto e on-premise. Le piattaforme dati virtuali garantiscono l’affidabilità di un data warehouse on-premise con costi contenuti non eguagliabili dall’hardware fisico. Le organizzazioni utilizzano queste piattaforme per ottenere uno scambio dati più flessibile a supporto di un processo decisionale aziendale più informato.
L’elasticità delle piattaforme dati cloud
Le piattaforme dati cloud sono molto più elastiche delle loro controparti on-premise e forniscono una vista integrata dei dati in hosting sulla piattaforma. Queste piattaforme consentono la piena osservabilità di tutto quanto viene eseguito su di esse, tra cui CPU e utilizzo della memoria, oltre a informazioni sulle query in esecuzione e al modo in cui possono essere ottimizzate.
I dati vengono archiviati in cluster e, osservando il comportamento effettivo dei carichi di lavoro, l’impresa può ampliare o ridimensionare un cluster per evitare il sottoutilizzo della capacità.
Passaggio a una piattaforma dati cloud
I CIO hanno spesso difficoltà a prevedere i picchi di utilizzo della loro impresa, aumentando in questo modo le possibilità di overprovisioning dei data warehouse per evitare problemi di prestazioni. Risultano quindi chiari i vantaggi della modernizzazione delle risorse dati e il loro spostamento su una piattaforma dati cloud in grado di scalare rapidamente.
Molti CIO hanno tuttavia difficoltà a rinunciare a più di sessant’anni di esecuzione e mantenimento dei carichi di lavoro on-premise. Per stare al passo con i dati, le imprese devono eseguire un’analisi costi-benefici del potenziale passaggio a una piattaforma dati cloud. Devono sostanzialmente decidere se il costo della migrazione e delle nuove licenze compensa il costo dell’overprovisioning e delle operazioni a lungo termine.
Qual è l’architettura di una piattaforma dati cloud?
Una tipica piattaforma dati è costituita da più componenti che si occupano dei diversi aspetti della gestione dei dati. L’architettura è così suddivisa:
- Derivazione dei dati
- Sicurezza dei dati e generazione dei registri di controllo
- Metadati, glossario aziendale, catalogo dati e ricerca dei dati
- Storage ed elaborazione
- Governance dei dati
- Qualità e attendibilità dei dati
Il cloud stesso consente agli utenti di separare tutti i componenti delle piattaforme dati, aiutando le aziende a scalare le applicazioni e ad evitare di rimanere bloccate nei tool proprietari di fornitori. Inoltre, la maggior parte delle piattaforme dati cloud fornisce elaborazione e storage separati per livelli di controllo e agilità dei dati migliori.
I dati vengono prima importati e quindi ripuliti in pipeline. Per quanto riguarda lo storage, le piattaforme dati cloud archiviano i dati in due tier: uno per i dati attivi e l’altro per i dati inattivi. Il primo tier è la memoria, dove vengono conservati l’indice dei dati e quelli a cui si accede con maggiore frequenza. Il secondo tier è un disco locale o un disco persistente (spesso un’unità a stato solido), generalmente un cloud object storage di base. Le prestazioni di questo tier sono generalmente più lente.
Per l’archiviazione dei dati, la piattaforma dati cloud scrive prima gli aggiornamenti nel tier in-memory più veloce, quindi li copia nel tier cloud object storage per migliorare le prestazioni complessive. Il tier dei dati attivi importa i dati dal tier dei dati inattivi quando richiesto e li analizza a livello granulare molto approfondito, facilitando il percorso verso le informazioni business-critical.
QUALI SONO I VANTAGGI E GLI SVANTAGGI DELLE PIATTAFORME DATI CLOUD?
La variazione dei carichi di lavoro e il continuo aumento del volume dei dati non strutturati contribuiscono ad accelerare in misura sempre maggiore la modernizzazione dell’IT. Le organizzazioni devono tuttavia valutare attentamente se e come inserire l’infrastruttura cloud, ad esempio le piattaforme dati cloud all’interno del loro ecosistema IT.
Vantaggi
- Flessibilità: le piattaforme dati cloud possono scalare la capacità in modo semplice e rapido di pari passo con l’evoluzione delle esigenze di analisi e dati.
- Visibilità: le piattaforme dati cloud acquisiscono rapidamente i dati strutturati e non, consentendo analisi più rapide.
- Accesso: lo spostamento delle risorse al cloud facilita la creazione di un data lake per democratizzare i dati e condividerli ovunque e in qualsiasi momento.
- Costi per risorse correttamente dimensionate: anziché pagare per l’overprovisioning del sistema, l’uso di una piattaforma dati cloud con il suo modello basato sul consumo consente alle imprese di pagare solo per quello che utilizzano, quando lo utilizzano.
Svantaggi
- Utilizzo: l’utilizzo del data center può passare rapidamente dalla piena capacità ai due terzi quando i carichi di lavoro vengono spostati nel cloud. L’eliminazione del ciclo di aggiornamento di un unico server darà luogo a questo scenario.
- Complessità: il trasferimento dei carichi di lavoro può incrementare la complessità delle operazioni IT, le decisioni sull’espansione o sul ridimensionamento vengono prese caso per caso, in base ai cambiamenti delle priorità o del portafoglio dell’azienda e ai trasferimenti stessi.
- Maggiore pressione per la conformità: le normative sulla privacy e sulla residenza dei dati continuano a evolvere, cambiando l’esigenza di spostare i carichi di lavoro.
Come vengono utilizzate le piattaforme dati cloud?
Per la loro natura elastica, le piattaforme dati cloud sono il tool ideale per rispondere ai carichi di lavoro in costante cambiamento, agli obiettivi di business e ai mercati. Ma come le utilizzano esattamente le aziende? Continua a leggere per scoprire alcuni casi d’uso:
- Consolidamento dei dati: anziché utilizzare diversi fogli di calcolo e altre origini dati su file flat, gli analisti utilizzano le piattaforma dati cloud per realizzare un “data mart”. Qui possono caricare e ottimizzare facilmente i dati da diverse origini per analisi e informazioni fruibili.
- Informazioni operative: i dati su una piattaforma dati cloud possono essere integrati facilmente con applicazioni business-critical, offrendo un modo semplice per rendere operativi i risultati e reinserirli nelle applicazioni, supportando decisioni data-driven.
- Analisi versatile: i data analyst dispongono di tutti i loro tool preferiti, in particolare i tool open source, che possono non essere compatibili con le piattaforme dati fisse. Le piattaforme dati cloud offrono la piena interoperabilità, che consente agli abbonati di collegare i propri tool e utilizzarli all’interno della piattaforma. In questo modo possono migrare le informazioni a un altro tool, se necessario, ed evitare la dipendenza da un fornitore.
- Elaborazione dei dati in streaming: una piattaforma dati cloud abbina la capacità dei data lake e dei data warehouse di elaborare i dati in streaming e altri dati aziendali non strutturati, supportando il machine learning (ML).
HPE e le piattaforma dati cloud
Le organizzazioni devono affrontare diverse problematiche nella gestione dei dati, non solo come ottimizzare i carichi di lavoro dei dati sul cloud, ma anche in ambienti ibridi che includono infrastruttura edge, data center, cloud e multi-cloud. HPE propone una piattaforma edge to cloud che consente agli utenti di eseguire applicazioni e servizi on-premise e nel cloud, oltre ai servizi per la gestione del carico di lavoro. Ad esempio, il portafoglio in espansione di HPE GreenLake cloud services comprende:
- Analisi: servizi cloud di analisi aperti e unificati per estendere la modernizzazione di tutti i dati e le applicazioni on-premise, all’edge e nel cloud.
- Protezione dei dati: servizi cloud di disaster recovery e backup per aiutare i clienti ad affrontare in modo efficace le minacce ransomware e proteggere i dati dall’edge al cloud.
- Framework di adozione edge to cloud HPE e tool di automazione: un set completo e collaudato di metodologie, competenze e tool di automazione per accelerare ed eliminare i rischi del percorso verso i vantaggi del cloud esteso.
- HPE Ezmeral Data Fabric Object Store: una tecnologia di storage basata su Kubernetes eseguibile in tutti gli ambienti ibridi. Consente agli utenti di abbinare diversi tipi di dati da file, flussi di eventi basati su oggetti e database nello stesso data fabric.
HPE ha recentemente introdotto anche Ezmeral Unified Analytics, una piattaforma data lakehouse cloud sviluppata con un gruppo di tecnologie open source che forniscono un data fabric agli utenti per l’esecuzione di carichi di lavoro di analisi dati e Business Intelligence senza dipendere dalla tecnologia di un unico fornitore.