Wie Neugier den Weg zum Supercomputing einläutet
Die Geschichte der Cray Supercomputer.
Die Grenzen des Möglichen aufheben
Alles begann mit der Vision einer einzelnen Person. Seymour Cray liebte es, Computer zu entwerfen. Er liebte die Herausforderung, immer mehr Geschwindigkeit aus Schaltkreisen und Drähten herauszuholen. Und er liebte den Reiz, dabei Einfachheit und herausragendes Design zu erzielen.
1972 gründete er Cray Research, um sich neuen Fragen zu stellen. Um seine Vision der schnellsten Computersysteme der Welt zu verwirklichen. Hindernisse nahm er achselzuckend zur Kenntnis und machte sich wieder an die Arbeit.
Mit einer kleinen Gruppe von Ingenieuren verwandelte Cray mit dem Cray-1 Supercomputer seine Vision in Wirklichkeit. Der Cray-1 ist ein Meisterwerk der Technik und hat in der Computingtechnologie – von der Verarbeitung über die Kühlung bis zum Gehäuse – neue Maßstäbe gesetzt. Und hat dafür gesorgt, dass ein Unternehmen und eine Branche dauerhaft in die Geschichte eingehen.
Von Cray-1 zu HPE Cray
Anfangs bestand die Mission von Cray Research darin, die schnellsten Computer zu bauen und umfangreiches wissenschaftliches Computing durchzuführen. Doch als das Unternehmen das Potenzial dieser Systeme erkannte, entwickelte sich die Mission weiter. Ziel war es nun dabei zu helfen, wissenschaftliche und industrielle Probleme zu lösen und die Welt sicherer, gesünder und intelligenter zu machen.
HPE teilt die Vision, die mit Seymour Cray begann. Mit der Übernahme von Cray im Jahr 2019 schlug HPE ein neues Kapitel in der spannenden und anhaltenden Erfolgsgeschichte des Supercomputing auf.
Die 1970er bis 1980er Jahre: von revolutionären Ideen zu Gigaflops und Galliumarsenid
Cray-1 – 1976
Erster Kunde: Los Alamos National Laboratory (abgebildet)
Fun Fact: Zwischen 1976 und 1982 war der Cray-1 der weltweit schnellste Supercomputer. Er war ca. 2,5 Meter breit und 2 Meter hoch und enthielt fast 100 Kilometer Kabel.
Technik-Story: Cray Research erzielte die Rekordleistung des Cray-1 von 160 Megaflops durch seine geringe Größe und zylindrische Form, einen Halbleiterspeicher mit 1 Million Wörtern, 64-Bit-Wortgröße, einen optimierten Fortran-Compiler und eine Technik namens „Chaining“.
Cray X-MP – 1982
Erster Kunde: Digital Productions
Fun Fact: Die Filmfirma Digital Productions verwendete ihr Cray X-MP-System, um Bilder für den Kultfilm The Last Starfighter zu erstellen – einen der ersten Filme mit computergenerierten Bildern.
Technik-Story: Mit dem X-MP-System stieg Cray auf die parallele Verarbeitung um. Es zeichnete sich durch zwei parallele Vektorprozessoren mit gemeinsamem Arbeitsspeicher und einer Taktperiodendauer von 9,5 Nanosekunden aus. Cray produzierte 11 verschiedene Versionen des X-MP – die schnellste mit 941 Megaflops.
Cray-2 – 1985
Erster Kunde: National Magnetic Fusion Energy Computer Center
Fun Fact: Der Cray-2-Supercomputer erhielt den Spitznamen „Bubbles“. Er war der erste Computer, bei dem eine Tauchkühlung zum Einsatz kam. Die Schaltkreise liefen so heiß, dass die Flüssigkeit zu kochen begann. Also veränderte Seymour Cray das Design und machte die kochende Flüssigkeit durch Glasscheiben sichtbar.
Technik-Story: Der Cray-2 hatte eine Vektorarchitektur mit vier Prozessoren mit einem 64-Bit-Arbeitsspeicher von 256 Millionen Wörtern (der größte auf einem Computer verfügbare zentrale Speicher) und einer Taktrate von 4,1 Nanosekunden. Seine Maximalgeschwindigkeit betrug 1,9 Gigaflops.
Cray Y-MP – 1988
Erster Kunde: NASA Ames Research Center
Fun Fact: Der Cray Y-MP-Supercomputer hat einen Gastauftritt im Film Sneakers von 1992. Die Hauptdarsteller des Films (Ben Kingsley und Robert Redford) sitzen auf einem Y-MP und diskutieren, wie man die Welt verändern kann.
Technik-Story: Der Y-MP war der weltweit erste Supercomputer, der mehr als 1 Gigaflop unterstützen konnte. Als Nachfolger des X-MP verfügte das ursprüngliche System über acht parallele Vektorprozessoren, dichtere Schaltkreise und einen größeren zentralen Arbeitsspeicher. Der Y-MP erreichte eine Maximalgeschwindigkeit von 2,67 Gigaflops.
Die 1990er bis 2000er Jahre: Veränderung und Wachstum
Cray C90 – 1991
Erster Kunde: Das Europäische Zentrum für mittelfristige Wettervorhersage
Fun Fact: Die Ford Motor Company war der erste gewerbliche Kunde, der das Cray C90-System erwarb.
Technik-Story: Das parallele Vektorsystem, das zunächst als Cray Y-MP C90-Supercomputer bezeichnet wurde, verfügte über 16 moderne CPUs mit jeweils 1 Gigaflop und 2 Gigabyte zentralem Arbeitsspeicher. Seine Leistung war 5-mal höher als Crays bisherige Bestleistung. Eines seiner wichtigsten Architekturmerkmale war eine Dual-Vektor-Pipeline, mit der jede der CPUs in jeder Taktperiode zwei Vektorergebnisse pro Funktionseinheit liefern konnte.
Cray Y-MP EL – 1991
Fakten zu Kunden: Bestellte allein im ersten Jahr 55 Systeme
Fun Fact: Das Cray Y-MP EL-System war der erste Supercomputer, den Cray Research jemals in der Finanzdienstleistungsbranche und in Osteuropa verkauft hat.
Technik-Story: Mit dem Y-MP EL-Supercomputer wurden die Einstiegskosten für Kunden gesenkt. Er konnte mit bis zu vier Prozessoren und 1.042 Megabyte Arbeitsspeicher konfiguriert werden. Der Y-MP EL war luftgefühlt, kompakt und leicht zu betreiben. Und dank ausgewogenem Arbeitsspeicher und I/O-Bandbreite bot der Y-MP EL den höchsten verfügbaren Durchsatz in seiner Preisklasse. Er wurde später zur EL90-Serie weiterentwickelt.
Cray M90 – 1992
Erster Kunde: AT&T Bell Labs
Fun fact: Der Cray M90-Supercomputer bot bis zu 125-mal mehr Arbeitsspeicherkapazität als das ursprüngliche Y-MP-System.
Technik-Story: Die Cray M90-Supercomputerserie (ursprünglich als Y-MP M90 bezeichnet) war eine Variante des Cray Y-MP-Systems mit großem Arbeitsspeicher. Er wurde in DRAM-Technologie implementiert und in Konfigurationen mit zwei, vier oder acht Prozessoren und bis zu 4 Milliarden Wörtern Arbeitsspeicher angeboten. Auf diese Weise konnten Benutzer komplexe Probleme angehen, ohne sie aufsplitten und separat ausführen zu müssen.
Cray T3D – 1993
Erster Kunde: Pittsburgh Supercomputing Center
Fun Fact: Die Missionsplaner der NASA im Jet Propulsion Laboratory nutzten ein T3D-System, um die besten Landungsmöglichkeiten eines Raumfahrzeugs auf dem Mars zu erkunden.
Technik-Story: Der Cray T3D-Supercomputer war Crays erstes massiv paralleles Verarbeitungssystem und das weltweit erste skalierbare heterogene System. Der T3D wurde in nur 26 Monaten konzipiert, entwickelt, hergestellt und geliefert. Der T3D verband ein massiv paralleles Array von Mikroprozessoren der Digital Equipment Corporation mit einem von Cray entworfenen Vektorprozessor und war in Größen von 32 bis 2.084 Prozessoren erhältlich.
Cray J90 – 1994
Fakten zu Kunden: 37 Vorbestellungen noch vor der offiziellen Ankündigung
Fun Fact: Die J90-Serie war mit mehr als 170 verkauften Systemen im ersten Jahr das am schnellsten verkaufte Produkt von Cray – 40 % davon gingen an Cray-Erstkunden.
Technik-Story: Die J90-Serie war ein skalierbares, kostengünstigeres System, das in Konfigurationen mit 8, 16 und 32 Prozessoren angeboten wurde. Durch die Reduzierung der Komplexität der CPUs und die Verwendung kostengünstiger und schneller CMOS-Chips (Complementary Metal Oxide Semiconductor) wurde die 10- bis 20-fache Bandbreite konkurrierender Systeme und ein besseres Preis-Leistungs-Verhältnis erzielt. Die Preise für die Systeme begannen bei 225.000 US-$.
Cray T90 – 1995
Fakten zu Kunden: Acht Vorbestellung noch vor der offiziellen Ankündigung
Fun Fact: Das T90-System war der weltweit erste kabellose Supercomputer. Mit einem bahnbrechenden Gerät, das die Prozessormodule mit dem Arbeitsspeicher verband, konnte Cray alle internen Verkabelungen beseitigen. (Zum Vergleich: Das größte C90-System benötigte knapp 60 Kilometer Kabel.)
Technik-Story: Der Nachfolger der C90-Linie, die Cray T90-Serie mit paralleler Vektorverarbeitung, war mit bis zu 32 Prozessoren erhältlich und erzielte eine Leistung von bis zu 60 Gigaflops. Bei dem System wurden Verbindungskabel durch elektrisch aktivierte eZIF-Konnektoren (Nullkraftsockel) mit jeweils 400 Signalkontakten ersetzt.
Cray T3E – 1995
Erster Kunde: Pittsburgh Supercomputing Center
Fun Fact: Der Cray T3E war der weltweit erste Supercomputer, der 1 Teraflop in einer realen Anwendung unterstützen konnte. Bis 1997 konnten die T3E-Systeme 14 der 20 Top-Plätze auf der Liste der weltweit besten Supercomputer für sich verbuchen.
Technik-Story: Bei der effizienten und kostengünstigen Skalierung auf Tausende Prozessoren war der T3E unübertroffen. Jeder Teil des Systems skalierte mit der Anzahl der Prozessoren – Interprozessorkommunikation, Betriebssystem, I/O und Arbeitsspeicher – und machte den T3E dadurch einzigartig.
Cray SV1-Serie – 1998
Erster Kunde: Alabama Supercomputer Authority
Fun Fact: Die Ford Motor Company kaufte fünf Cray SV1-Supercomputer und wurde damit zum wichtigsten Kunden des Systems.
Technik-Story: Das skalierbare Vektorsystem SV1 enthielt Prozessoren mit einer Spitzenleistung von vier Gigaflops, Einzelgehäuseknoten mit einer Spitzenleistung von bis zu 32 Gigaflops und Systemclustering-Tools, die in Kombination einen Supercomputer über 1 Teraflop ergaben. Mit ihm wurden Innovationen wie der weltweit erste Vektor-Cache-Speicher eingeführt. Zudem zeichnete sich der SV1 durch ein 8-fach besseres Preis-Leistungs-Verhältnis aus.
Cray X1/X1E – 2002
Erster Kunde: US-Verteidungsministerium
Fun Fact: Die Cray® X1-Prozessoren liefen so heiß, dass die Ingenieure eine Verdunstungssprühtechnologie entwickelten, um eine Überhitzung der Module zu verhindern.
Technik-Story: Das Cray X1-System verband die Prozessorleistung von Vektorsystemen mit der Skalierbarkeit massiv paralleler Verarbeitungssysteme, was lange Zeit als unmöglich galt. Dank der leistungsstarken Interconnect- und Arbeitsspeichersubsysteme konnte das X1-System auf bis zu 4.096 Prozessoren mit einer Spitzenleistung von 50 Teraflops skaliert werden. Damit verdreifachte das X1E-System die Spitzenleistung und Rechendichte.
Cray XT-Serie – 2004
Erster Kunde: Sandia National Laboratories
Fun Fact: Mit dem XT5 „Jaguar“-System des Oak Ridge National Laboratory (abgebildet) überwand Cray die Petaflops-Grenze. Jaguar umfasste 200 Schränke, 224.256 Prozessorkerne und war mit 1,759 Petaflops von 2009 bis 2010 der weltweit schnellste Supercomputer.
Technik-Story: Cray entwickelte in Zusammenarbeit mit Sandia National Laboratories die Technologie hinter der Cray® XT™-Serie. Das massiv parallele XT-System nutzte eine von Cray entworfene Interconnect-Technologie, war luftgekühlt und konnte von einem einzelnen Schrank auf Hunderte skaliert werden.
Cray XMT – 2006
Erster Kunde: Pacific Northwest National Laboratory
Fun Fact: Ein Forscher am Georgia Institute of Technology verwendete das Cray® XMT™-System von PNNL, um die einflussreichsten Twitter-Nutzer im Jahr 2009 zu identifizieren. Das System verarbeitete innerhalb einer Stunde die Tweets eines Tages von rund 18 Millionen Nutzern.
Technik-Story: Das Cray XMT-System war eine skalierbare, massive Multithread-Plattform mit einer Shared-Memory-Architektur, die sich ideal für umfangreiche Datenanalysen und Data Mining eignet. Das Design basierte auf einem Cray XT-Computing-Blade, verwendete jedoch benutzerdefinierte Cray Threadstorm-Chips. Ein einzelner Threadstorm-Prozessor konnte 128 gleichzeitige Threads unterstützen.
Die 2010er Jahre: Nutzung von Big Data
Cray XE6 – 2010
Fakten zu Kunden: Das Swiss National Supercomputing Centre (CSCS) erhielt das erste Beta-System.
Fun Fact: Wissenschaftler lösten mit dem Cray® XE6™-System von CSCS das 300 Jahre alte Rätsel, warum sich das Magnetfeld der Erde nach Westen verschiebt. Tipp: Es hat mit dem Kern zu tun.
Technik-Story: Bei dem XE6-Supercomputer wurde die Infrastruktur der XT-Serie genutzt und Multicore-AMD-Prozessoren sowie die bahnbrechende Cray Gemini-Verbindung integriert. Gemini lieferte extreme Messaging-Raten und eine deutlich verbesserte Latenz. Der XE6 konnte auf über 1 Millionen Prozessorkerne skaliert werden und eine Leistung von mehr als 10 Petaflops liefern.
Cray XK-Serie – 2011
Erster Kunde: Swiss National Supercomputing Centre
Fun Fact: Das Cray® XK™-System „Titan“ im Oak Ridge National Laboratory (abgebildet) führte 2012 die Liste der weltweit schnellsten Computer an. Sieben Jahre lang blieb es unter den Top 10. Im Jahr 2019 setzte das ORNL ein Cray® Shasta™-System mit dem Namen „Frontier“ als Nachfolger von „Titan“ ein.
Technik-Story: Die Cray XK-Serie kombinierte die Gemini-Verbindung, AMD Multicore-Skalarprozessoren und NVIDIA Mehrkern-GPUs zu einem echten Hybrid-Supercomputer. Das System konnte auf über 500.000 Prozessen skaliert werden und eine Leistung von mehr als 30 Petaflops liefern.
Cray XC-Serie – 2012
Erster Kunde: High Performance Computing Center Stuttgart (abgebildet)
Fun Fact: Der 2016 eingeführte XC50-Supercomputer konnte eine Spitzenleistung von 1 Petaflop in einem einzigen Gehäuse liefern. Zum Vergleich: Das erste Cray-System, das im Petaflops-Bereich arbeiten konnte, hatte 200 Gehäuse.
Technik-Story: Cray® XC™-Systeme sind auf 500 Petaflops skalierbar und kombinieren Skalarverarbeitung, Co-Verarbeitung und Beschleunigertechnologie in einer einzigen, extrem skalierbaren Maschine. Zudem wurde mit der XC-Serie der Aries-Interconnect eingeführt, der über alle Metriken hinweg deutliche Verbesserungen lieferte und die Herausforderung einer kostengünstigen, skalierbaren globalen Bandbreite löste.
Cray Urika-Plattformen – 2012
Fakten zu Kunden: Mehrere frühzeitige Anwender setzten auf das erste Cray® Urika®-Produkt, darunter das Institute of System Biology, die Mayo Clinic, Noblis und das Swiss National Supercomputing Centre.
Fun Fact: Urika wurde zunächst uRiKA geschrieben. Es stand für Universal RDF Integration Knowledge Appliance.
Technik-Story: Das erste Urika-Produkt wurde für einen grafikbasierten Ansatz zur Analyse von Big Data-Beziehungen entwickelt. Dabei kamen Crays Threadstorm massive Multithread-Prozessoren und eine massive Shared-Memory-Architektur zum Einsatz. Bei dem späteren Produkt Urika-GD kamen die Urika-XA-Plattform für extreme Analysen und die Urika-GX-Plattform für agile Analysen hinzu.
Cray CS-Serie – 2013
Fakten zu Kunden: Das Railway Technical Research Institute war der erste öffentlich angekündigte Kunde für die CS-Serie.
Fun Fact: Was haben Shadow, Ollie, BeBop und Nurion gemeinsam? Tipp: Es sind keine Haustiere. Es sind einige der Systeme der CS-Serie, die es in die Liste der TOP500-Supercomputer geschafft haben. Nurion war im Jahr 2018 sogar auf Platz 11.
Technik-Story: Die Cluster-Supercomputer der Cray® CS™-Serie verfügten über die neuesten Verarbeitungs-, Netzwerk- und Kühltechnologien und waren in hohem Maße in puncto Computing-, Daten- und Hybrid-Workloads anpassbar. Die letzte Version der Serie – das CS500-System – konnte auf über 60 Petaflops skaliert werden.
Cray CS-Storm – 2014
Erster Kunde: US-Regierung
Fun Fact: Als das Cray® CS-Storm™-System 2014 auf den Markt kam, war es das dichteste GPU-System der Welt.
Technik-Story: Der CS-Storm Supercomputer basierte auf der Architektur der CS-Serie und wurde für GPU-beschleunigte Workloads entwickelt. Ein einzelnes Rack mit hoher Dichte lieferte bis zu 980 Teraflops an Leistung mit doppelter Genauigkeit. Das System eignet sich ideal zur Beschleunigung von Computing-Workloads wie maschinelles Lernen und Deep Learning, Reservoir-Simulation und geografische Aufklärung.
HPE Cray EX – 2018
Erster Kunde: Argonne National Laboratory
Fun Fact: Ein HPE Cray Exascale Supercomputer ist 6 Milliarden Mal schneller als der Cray-1.
Technik-Story: Der HPE Cray Supercomputer wurde für Workloads der Exascale-Ära entwickelt. Er unterstützt eine Vielzahl von Prozessortechnologien und konvergente Workloads, schafft den Unterschied zwischen Supercomputern und Clustern ab und kombiniert HPC- und KI-Workloads mit der Produktivität der Cloud. Der revolutionäre HPE Slingshot Interconnect dient dabei als Backbone. Die ersten drei Exascale Supercomputer der USA sind HPE Cray Systeme.