Cloud-Datenplattform
Was ist eine Cloud-Datenplattform?
Eine Cloud-Datenplattform ist ein Rechenzentrum, das sich in der Cloud befindet und einen Server und Datenspeicher enthält. Sie bietet einen virtualisierten Zugang zu Daten aus mehreren Quellen an mehreren Standorten.
Was leistet eine Cloud-Datenplattform?
Ein Schritt bei der digitalen Transformation eines Unternehmens besteht darin, das Datenökosystem und die Unternehmensdaten von den traditionellen Rechenzentren oder Lagern vor Ort in die Cloud zu verlagern. Eine Cloud-Datenplattform ist der Ort, an den diese Ressourcen verlagert werden und der es Unternehmen ermöglicht, einen Data Lake zu gestalten, auf den jederzeit und überall zugegriffen werden kann. Mit diesen „demokratisierten“ Daten können sowohl strukturierte als auch unstrukturierte Daten schnell eingelesen werden, um Analysen zu ermöglichen. Die Plattform kann außerdem schnell skaliert werden, wenn sich die Daten- und Analyseanforderungen verändern.
Warum verwenden Unternehmen eine Cloud-Datenplattform?
Durch die Verwendung einer Cloud-Datenplattform erhalten Unternehmen eine einfachere Möglichkeit, ihre Daten zu nutzen. Die Daten können von jedem beliebigen Standort aus gemanagt, gesichert und eingesehen werden, remote und vor Ort. Diese virtuellen Datenplattformen bieten die Zuverlässigkeit eines Data Warehouse vor Ort und sind dabei so erschwinglich, dass physische Hardware nicht mithalten kann. Unternehmen verwenden diese Plattformen, um einen viel flexibleren Datenaustausch zu erreichen, was dann zu fundierteren Geschäftsentscheidungen führt.
Elastizität der Cloud-Datenplattform
Cloud-Datenplattformen sind weitaus elastischer als ihre Pendants vor Ort und bieten eine integrierte Sicht auf die Daten, die auf der Plattform gehostet sind. Diese Plattformen ermöglichen die vollständige Einsehbarkeit aller auf ihnen durchgeführten Vorgänge, einschließlich der CPU- und Arbeitsspeicherauslastung, sowie einen Einblick in die durchgeführten Abfragen und deren Optimierung.
Die Daten werden in Bündeln gespeichert, und durch die Einsehbarkeit des tatsächlichen Workload-Verhaltens kann ein Unternehmen einzelne Bündel vergrößern oder verkleinern, um zu vermeiden, dass sie nicht ausgelastet sind.
Umstellung auf eine Cloud-Datenplattform
Für CIOs ist es oft schwierig, die Spitzenauslastung ihres Unternehmens vorherzusagen. Daher ist es wahrscheinlich, dass sie ihre Data Warehouses zu groß planen, damit Performance-Probleme vermieden werden. Die Datenressourcen zu modernisieren und sie auf eine Cloud-Datenplattform zu verlagern, die schnell skaliert werden kann, scheint daher von Vorteil zu sein.
Viele CIOs sind jedoch nicht bereit, eine jahrzehntelang eingeübte Praxis aufzugeben, bei der sie ihre Workloads vor Ort durchgeführt und gepflegt haben. Um den Überblick über ihre Daten zu behalten, müssen Unternehmen eine Kosten-Nutzen-Analyse für einen möglichen Wechsel zu einer Cloud-Datenplattform durchführen. Grundsätzlich müssen sie entscheiden, ob die Kosten für die Migration und neue Lizenzen die Kosten für die Überbereitstellung und den langfristigen Betrieb überwiegen.
Was ist die Architektur einer Cloud-Datenplattform?
Eine typische Datenplattform besteht aus mehreren Komponenten, die verschiedene Aspekte des Datenmanagements behandeln. Die Architektur ist in Schichten aufgebaut:
- Datenabstammung
- Datensicherheit und Audit-Protokollierung
- Metadaten, Unternehmensglossar, Datenkatalog und Datensuche
- Speicherung und Computing
- Daten-Governance
- Datenqualität und Vertrauen in Daten
Die Cloud ermöglicht es Anwendern, alle Komponenten von Datenplattformen zu entkoppeln, die Unternehmen dabei helfen, Anwendungen zu skalieren und sich nicht an die proprietären Werkzeuge eines Anbieters zu binden. Und die meisten Anbieter von Cloud-Datenplattformen trennen Rechen- und Speicherkomponenten, um eine bessere Datenkontrolle und Agilität zu gewährleisten.
Die Daten werden zunächst importiert und dann in Data Pipes bereinigt. Was die Speicherung betrifft, so speichern Cloud-Datenplattformen die Daten auf zwei Tiers: eine für „heiße“ Daten und eine für „kalte“ Daten. Der erste Tier ist der Arbeitsspeicher, in dem die Datenindexierung und die Daten, auf die am häufigsten zugegriffen wird, gespeichert werden. Der zweite Tier ist die lokale Festplatte oder persistente Festplatte (oft eine Solid-State-Disk), die in der Regel als einfacher Cloud Object Storagedient. Dieses Tier bietet in der Regel eine geringere Leistung.
Um Daten zu speichern, schreibt die Cloud-Datenplattform Aktualisierungen zunächst in den schnellsten In-Memory-Tier und kopiert sie dann in den Cloud-Objektspeicher-Tier, um die Leistung insgesamt zu verbessern. Der Tier für heiße Daten zieht bei Abfragen Daten aus dem Tier für kalte Daten heran und sieht sich die Daten auf einer sehr tiefen, granularen Ebene an, welche den Weg zu geschäftskritischen Einblicken erleichtert.
WAS SIND DIE VOR- UND NACHTEILE VON CLOUD-DATENPLATTFORMEN?
Da die Workloads fluktuieren und das unstrukturierte Datenvolumen weiter steigt, nimmt der Druck zur Modernisierung der IT zu. Unternehmen müssen jedoch sorgfältig in Erwägung ziehen, ob und wie sie Cloud-Infrastrukturen, wie z. B. Cloud-Datenplattformen, in ihr IT-Ökosystem einbinden.
Vorteile
- Flexibilität: Wenn sich die Daten- und Analyseanforderungen weiterentwickeln, können Cloud-Datenplattformen die Kapazität schnell und einfach skalieren.
- Sichtbarkeit: Cloud-Datenplattformen nehmen strukturierte und unstrukturierte Daten schnell auf und ermöglichen so schnellere Analysen.
- Zugang: Die Verlagerung von Ressourcen in die Cloud erleichtert die Schaffung eines Data Lake, um Daten zu demokratisieren und sie überall und jederzeit zu teilen.
- Richtig bemessene Kosten: Anstatt für ein System mit Überbereitstellung zu zahlen, können Unternehmen mit einer Cloud-Datenplattform mit ihrem verbrauchsbasierten Modell nur für das bezahlen, was sie verwenden, wenn sie es verwenden.
Nachteile
- Auslastung: Die Auslastung des Rechenzentrums kann sich schnell von der kompletten Kapazität zu zwei Dritteln der Auslastung verändern, wenn Workloads in die Cloud verlagert werden. Der Verzicht auf einen einzigen Server-Refresh-Zyklus wird dieses Szenario gestalten.
- Komplexität: Die Verlagerung von Workloads kann die Komplexität des IT-Betriebs steigern – Entscheidungen über eine Erhöhung oder Verringerung der Leistung werden von Fall zu Fall getroffen, wenn sich Veränderungen bei den Fachleuten oder im Portfolio ergeben und sich der Workload verschiebt.
- Erhöhter Druck zur Compliance: Die Vorschriften zum Datenschutz und zur Datenaufbewahrung entwickeln sich ständig weiter, sodass sich die Notwendigkeit, Workloads zu verschieben, ändert.
Wie werden Cloud-Datenplattformen verwendet?
Die elastische Natur von Cloud-Datenplattformen macht sie zu einem idealen Werkzeug, um auf sich verändernde Workloads, Geschäftsziele und Märkte zu reagieren. Aber wie genau werden sie von Unternehmen verwendet? Lesen Sie nachfolgend ein paar Anwendungsfälle:
- Datenkonsolidierung: Anstatt mehrere Tabellenkalkulationen und andere Flat-File-Datenquellen zu verwenden, bauen Analysten mit Cloud-Datenplattformen einen „Data Mart“. Dort können sie ganz einfach Daten aus verschiedenen Quellen laden und optimieren, um sie zu analysieren und umsetzbare Erkenntnisse zu gewinnen.
- Operativer Einblick: Daten auf einer Cloud-Datenplattform lassen sich leicht in geschäftskritische Anwendungen integrieren. So können die Ergebnisse auf einfache Weise operationalisiert und in Anwendungen zurückgeführt werden, um datenorientierte Entscheidungen zu ermöglichen.
- Vielseitige Analyse: Datenanalysten haben alle ihre eigenen bevorzugten Werkzeuge, insbesondere Open Source Tools, die mit festen Datenplattformen inkompatibel sein können. Cloud-Datenplattformen bieten komplette Interoperabilität, die es Abonnenten ermöglicht, ihre eigenen Werkzeuge einzubinden und sie innerhalb der Plattform zu verwenden. Auf diese Weise können sie bei Bedarf Erkenntnisse zu einem anderen Tool migrieren und Anbieterabhängigkeit vermeiden.
- Verarbeitung von Streaming-Daten: Eine Cloud-Datenplattform kombiniert die Fähigkeiten eines Data Lake und eines Data Warehouse, um Streaming-Daten und andere unstrukturierte Unternehmensdaten zu verarbeiten und maschinelles Lernen (ML) zu ermöglichen.
HPE und Cloud-Datenplattformen
Unternehmen stehen beim Management ihrer Daten vor vielen Herausforderungen – nicht nur bei der Optimierung von Daten-Workloads in der Cloud, sondern auch in hybriden Umgebungen, die Edge-, Rechenzentrums-, Cloud- und Multi-Cloud-Infrastrukturen umfassen. Neben Services zum Management von Workloads bietet HPE eine Edge-to-Cloud-Plattform, mit der Anwender Anwendungen und Services vor Ort und in der Cloud durchführen können. Das wachsende Portfolio der HPE GreenLake Cloud Services enthält zum Beispiel:
- Analysen: Offene und einheitliche Analyse-Cloud-Services zur Modernisierung aller Daten und Anwendungen überall – vor Ort, am Edge und in der Cloud.
- Datenschutz: Disaster-Recovery- und Backup-Cloud-Services, mit denen Kunden sich vor Ransomware schützen und Daten vom Edge bis zur Cloud sichern können.
- HPE Edge-to-Cloud Adoption Framework- und Automatisierungstools: eine umfassende Reihe bewährter Methoden, Fachkenntnisse und Automatisierungstools zur Beschleunigung und Risikominderung auf dem Weg zum Besten der Cloud, überall.
- HPE Ezmeral Data Fabric Object Store: Eine Kubernetes-basierte Speichertechnologie, die in hybriden Umgebungen durchgeführt werden kann. Sie ermöglicht es Anwendern, verschiedene Datentypen aus Dateien, Objekt-Event-Streams und Datenbanken in der gleichen Data Fabric zu kombinieren.
HPE hat außerdem kürzlich Ezmeral Unified Analytics vorgestellt, eine Cloud Data Lakehouse-Plattform, die mit einer Gruppe von Open-Source-Technologien gebaut wurde, die eine Datenstruktur bieten, mit der Benutzer Datenanalysen und Business Intelligence Workloads durchführen können, ohne an die Technologien eines einzelnen Anbieters gebunden zu sein.