Hewlett Packard Enterprise beschleunigt KI-Training mit neuer Komplettlösung und NVIDIA-Superchips

13. November 2023

Komplettlösung für Großunternehmen und Forschungseinrichtungen beschleunigt generative KI. Sie umfasst KI/ML-Software, Hardware, Netzwerke und Dienstleistungen.


BÖBLINGEN / HOUSTON – 13. November 2023 Hewlett Packard Enterprise (NYSE: HPE) hat eine Supercomputer-Lösung für generative KI angekündigt, die das Training und Tuning von KI-Modellen mit privaten Datensätzen beschleunigt. Zielgruppen sind Großunternehmen, Forschungseinrichtungen und größere Behörden. Zum Paket gehört eine Software-Suite für Training, Tuning und Entwicklung, flüssigkeitsgekühlte Supercomputer, KI-Beschleuniger, Netzwerke, Speicher und Dienstleistungen.


Die Software-Suite ist mit der Supercomputer-Technologie von HPE Cray integriert, die auf der gleichen Architektur wie der schnellste Supercomputer der Welt basiert und von NVIDIA Grace Hopper GH200 Superchips angetrieben wird. Damit bietet die neue Komplettlösung die Skalierbarkeit und Leistung, die für große KI-Workloads wie das Training von großen Sprachmodellen (LLM) und Deep-Learning-Empfehlungsmodellen (DLRM) erforderlich sind. Mit dem HPE Machine Learning Development Environment auf diesem System wurde das Open-Source-Modell Llama 2 mit 70 Milliarden Parametern in weniger als 3 Minuten feinabgestimmt1. HPEs Supercomputing-Lösung sorgt somit für eine 2-3-fache Leistungsverbesserung.


HPEs neue Supercomputer-Lösung für generative KI umfasst:


  • KI/ML-Beschleunigungssoftware: Eine Suite von drei Software-Werkzeugen, mit denen Kunden KI-Modelle trainieren, tunen und eigene KI-Anwendungen erstellen können:
    • HPE Machine Learning Development Environment ist eine Softwareplattform für maschinelles Lernen (ML), die die Entwicklung und Einführung von KI-Modellen beschleunigt. Sie umfasst gängige ML-Frameworks und vereinfacht die Datenaufbereitung.
    • NVIDIA AI Enterprise bietet umfangreiche Frameworks, vortrainierte Modelle und Werkzeuge, die die Entwicklung und Bereitstellung von Produktions-KI vereinfachen.
    • Das HPE Cray Programming Environment bietet Programmierern einen kompletten Werkzeug-Satz für die Entwicklung, Portierung, Fehlersuche und Verfeinerung von Code.

  • Die Lösung basiert auf der HPE Cray EX2500, einem System der Exascale-Klasse, und NVIDIA GH200 Grace Hopper Superchips. Sie kann auf Tausende von Grafikprozessoren skaliert werden, um große KI-Workloads zu unterstützen. Es handelt sich um das erste System mit der Vierfach-GPU-Konfiguration des GH200 Superchips.

  • HPE Slingshot Interconnect bietet ein offenes, Ethernet-basiertes Hochleistungsnetzwerk zur Unterstützung von Workloads der Exascale-Klasse.

  • Zum Komplettpaket gehören auch HPE Complete Care Services für Einrichtung, Installation und laufende Wartung.

Schätzungen zufolge wird das Wachstum von KI-Workloads bis 2028 etwa 20 Gigawatt Strom in Rechenzentren2 erfordern. Um die Auswirkungen ihres CO2-Fußabdrucks zu minimieren, werden Kunden energieeffizientere Lösungen benötigen. Die in der neuen Komplettlösung eingesetzten Supercomputer sind flüssigkeitsgekühlt und bieten damit bis zu 20 Prozent mehr Leistung pro Kilowatt als luftgekühlte Systeme und verbrauchen 15 Prozent weniger Strom3. Sechs der zehn energieeffizientesten Supercomputer auf der Green500-Liste wurden von HPE gebaut.


Verfügbarkeit: HPEs Supercomputing-Lösung für generative KI wird im Dezember 2023 in mehr als 30 Ländern verfügbar sein.


Weitere Informationen finden Sie unter:




1Unter Verwendung von 32 HPE Cray EX 2500-Knoten mit 128 NVIDIA H100-Grafikprozessoren bei einer Skalierungseffizienz von 97 % wurde ein Llama-2-Modell mit 70 Milliarden Parametern in internen Tests auf einem Korpus von 10 Millionen Token in weniger als 3 Minuten feinabgestimmt. Modellabstimmungscode und Trainingsparameter wurden zwischen den Skalierungsläufen nicht optimiert. Standard-KI-Benchmarks, BERT und Mask R-CNN, unter Verwendung eines nicht optimierten Systems, bestehend aus einem HPE Cray EX2500 Supercomputer mit einem HPE Cray EX254n Accelerator Blade mit vier NVIDIA GH200 Grace Hopper Superchips. Die unabhängig durchgeführten Tests zeigten eine 2-3-fache Leistungsverbesserung im Vergleich zu den von MLPerf 3.0 veröffentlichten Ergebnissen für ein A100-basiertes System mit zwei AMD EPYC 7763 Prozessoren und vier NVIDIA A100 GPUs mit NVLINK-Verbindungen.


2Avelar, Victor; Donovan, Patrick; Lin, Paul; Torell, Wendy; and Torres Arango, Maria A., The AI disruption: Challenges and guidance for data center design (White paper 110), Schneider Electric: https://download.schneider-electric.com/files?p_Doc_Ref=SPD_WP110_EN&p_enDocType=White+Paper&p_File_Name=WP110_V1.1_EN.pdf


3Basierend auf internen Leistungstests von HPE im April 2023 wurde festgestellt, dass flüssigkeitsgekühlte Lösungen eine Leistungssteigerung von bis zu 20 Prozent pro Kilowatt gegenüber luftgekühlten Lösungen ermöglichen und 15 Prozent weniger Strom verbrauchen.




Über Hewlett Packard Enterprise


Das globale Edge-to-Cloud-Unternehmen Hewlett Packard Enterprise (HPE) hilft Kunden, den Wert aller ihrer Daten an jedem Ort zu erschließen, sodass sie bessere Geschäftsergebnisse erzielen. Seit Jahrzehnten erfindet HPE die Zukunft neu und treibt Innovationen voran, um das Leben und die Arbeit der Menschen zu verbessern. HPEs offene und intelligente Technologielösungen – dazu gehören Cloud-Dienste, Server, Supercomputer, künstliche Intelligenz, Intelligent Edge, Software und Speicher – werden als Dienstleistung („as a service“) bereitgestellt und bieten eine einheitliche Nutzererfahrung über Clouds und verteilte Standorte hinweg. Das hilft Kunden, neue Geschäftsmodelle zu entwickeln, neue Prozesse einzuführen und ihre Betriebsleistung zu steigern. Weitere Informationen finden Sie hier: www.hpe.com


Pressekontakt


Hewlett Packard Enterprise

Deutschland, Österreich, Schweiz

Agentur Storymaker


Email: hpe@storymaker.de

Tel: +49-(0)7071-93872-0


Recommended for you