Une quête du calcul haute performance guidée par la curiosité

L’histoire des supercalculateurs Cray.

Le supercalculateur Cray Frontier.
Portrait de Seymour Cray.

Repousser les limites du possible

Tout a commencé par la vision d’un seul individu. Seymour Cray aimait concevoir des ordinateurs. Il était passionné par le défi qu’il y a à bichonner les circuits et les fils pour que les machines aillent toujours plus vite. Et il était sensible au charme de le faire avec simplicité et élégance.

Seymour Cray a fondé Cray Research en 1972 pour formuler de nouvelles questions et pour concrétiser son idée visionnaire du système informatique le plus rapide au monde. Il s’est dit que c’était impossible, puis il a haussé les épaules et s’est remis au travail.

Poursuivant cette idée visionnaire et aidé d’un petit groupe d’ingénieurs, Seymour Cray a créé le supercalculateur Cray-1. Ce chef-d’œuvre d’ingénierie redéfinissait totalement les technologies informatiques, du traitement au refroidissement en passant par l’assemblage. Et il a inscrit une entreprise et une industrie à tout jamais dans l’histoire.

Du Cray-1 à HPE Cray

À ses débuts, Cray Research s’était donné pour mission de construire les ordinateurs les plus rapides du marché et de mener des calculs scientifiques à grande échelle. Mais quand l’entreprise s’est rendu compte de ce que les utilisateurs pouvaient faire avec ces systèmes, cette mission a évolué. Au-delà de la simple recherche de la vitesse, Cray Research a pris l’engagement de contribuer à résoudre les grands problèmes scientifiques et industriels afin de rendre le monde plus sûr, plus sain et plus intelligent.

HPE partageait cette vision née avec Seymour Cray. C’est pourquoi, en 2019, HPE a acquis Cray pour écrire avec cette entreprise un nouveau chapitre de cette fascinante quête du calcul haute performance.

Des années 1970 aux années 1980 : des idées révolutionnaires aux gigaflops et à l’arséniure de gallium

Le Cray-1 en 1976.

Cray-1 – 1976

Premier client : Laboratoire national américain de Los Alamos (représenté sur la photo)

Petite anecdote : Le Cray-1 est resté le supercalculateur le plus rapide au monde de 1976 à 1982. Il mesurait environ 2,6 m de large par 2 m de haut et contenait près de 100 km de câbles.

Avancée technologique : Avec le Cray-1, Cray Research a atteint la performance record de 160 mégaflops avec une machine de petite taille et de forme cylindrique, une mémoire à semi-conducteurs de 1 million de mots par seconde, une longueur de mot de 64 bits, un compilateur Fortran optimisé et une technique appelée « chaînage ».

Le Cray X-MP en 1982.

Cray X-MP – 1982

Premier client : Digital Productions

Petite anecdote : La société cinématographique Digital Productions a utilisé le système Cray X-MP pour créer certaines images du film culte Starfighter, l’un des premiers à avoir utilisé des images générées par ordinateur.

Avancée technologique : Avec le Cray X-MP, Cray est passée au traitement parallèle. La machine intégrait deux processeurs vectoriels parallèles à mémoire partagée, avec un cycle d’horloge de 9,5 nanosecondes. La plus rapide des 11 versions du Cray X-MP produites par Cray culminait à 941 mégaflops.

Le Cray-2 en 1985.

Cray-2 – 1985

Premier client : National Magnetic Fusion Energy Computer Center

Petite anecdote : Le supercalculateur Cray-2 a été surnommé «∘Bubbles∘». En effet, c’était le premier à utiliser le refroidissement par immersion et ses circuits chauffaient tellement qu’ils faisaient bouillir le liquide. Seymour Cray a donc décidé de montrer ce phénomène, en rendant le liquide bouillonnant visible à travers des panneaux en verre.

Avancée technologique : Le Cray-2 possédait une architecture vectorielle à quatre processeurs avec 256 millions de mots mémoire de 64 bits (la plus grosse mémoire centrale jamais vue sur un ordinateur) et une fréquence d’horloge de 4,1 nanosecondes. Il a atteint une vitesse de pointe de 1,9 gigaflops.

Le Cray Y-MP en 1988.

Cray Y-MP – 1988

Premier client : Centre de recherches Ames de la NASA

Petite anecdote : Le supercalculateur Cray Y-MP fait une brève apparition dans le film Sneakers, en 1992. Les deux personnages principaux du film (Ben Kingsley et Robert Redford) discutent de la manière dont ils pourraient changer le monde, assis sur un Y-MP.

Avancée technologique : Le Cray Y-MP était le premier supercalculateur au monde à dépasser 1 gigaflops. Successeur du X-MP, le système initial comportait huit processeurs vectoriels parallèles, des circuits plus denses et une plus grosse mémoire centrale. Le Y-MP a atteint une vitesse de pointe de 2,67 gigaflops.

Des années 1990 aux années 2000 : le changement et la croissance

Le Cray C90 en 1991.

Cray C90 – 1991

Premier client : Centre européen pour les prévisions météorologiques à moyen terme

Petite anecdote : La Ford Motor Company a été la première entreprise commerciale à utiliser le système Cray C90.

Avancée technologique : D’abord appelé supercalculateur Cray Y-MP C90, ce système vectoriel parallèle comportait 16 nouveaux processeurs d’une capacité de 1 gigaflops chacun ainsi que 2 gigaoctets de mémoire centrale. Il était 5 fois plus rapide que son prédécesseur le plus performant. L’une de ses principales caractéristiques architecturales était un pipeline à deux vecteurs qui permettait à chacun des processeurs de fournir deux résultats vectoriels par unité fonctionnelle à chaque période d’horloge.

Le Cray Y-MP EL en 1991.

Cray Y-MP EL – 1991

Fait marquant : Le système a fait l’objet de 55 commandes rien que dans sa première année de commercialisation.

Petite anecdote : Le Cray Y-MP EL a été le premier supercalculateur vendu par Cray dans le secteur des services financiers et en Europe de l’Est.

Avancée technologique : Le Y-MP EL a abaissé le coût d’entrée pour les clients. Il pouvait être configuré avec jusqu’à 4 processeurs et 1 042 mégaoctets de mémoire. Il était compact, facile à alimenter et doté d’une technologie de refroidissement par air. Et avec sa mémoire équilibrée et sa bande passante E/S, ce supercalculateur offrait le plus haut débit disponible pour cette gamme de prix. Les développements ultérieurs du Y-MP EL ont abouti à la série EL90.

Le Cray M90 en 1992.

Cray M90 – 1992

Premier client : AT&T Bell Labs

Petite anecdote : Le supercalculateur Cray M90 avait une capacité mémoire jusqu’à 125 fois supérieure à celle du système Y-MP d’origine.

Avancée technologique : La série de supercalculateurs M90 de Cray (initialement appelée Y-MP M90) constituait une variante à mémoire étendue du système Y-MP. Implémenté en technologie DRAM, le M90 était disponible en configurations à 2, 4 ou 8 processeurs, avec jusqu’à 4 milliards de mots mémoire. Il permettait aux utilisateurs de résoudre d’énormes problèmes sans avoir à les décomposer en sous-parties à exécuter séparément.

Le Cray T3D en 1993.

Cray T3D – 1993

Premier client : Pittsburgh Supercomputing Center

Petite anecdote : Les planificateurs de mission du Jet Propulsion Laboratory de la NASA ont utilisé le système T3D pour déterminer les meilleurs sites d’atterrissage d’un engin spatial sur Mars.

Avancée technologique : Le supercalculateur Cray T3D a été le premier système de traitement massivement parallèle de Cray et le premier système hétérogène évolutif de cette catégorie au monde. Il a été conçu, développé, construit et livré en 26 mois seulement. Le T3D connectait un ensemble massivement parallèle de microprocesseurs produits par Digital Equipment Corporation à un processeur vectoriel créé par Cray, et était disponible dans des configurations allant de 32 à 2 084 processeurs.

Le Cray J90 en 1994.

Cray J90 – 1994

Fait marquant : Ce système a fait l’objet de 37 précommandes avant son lancement officiel.

Petite anecdote : La série J90 est le produit de Cray qui s’est vendu le plus vite, avec plus de 170 systèmes installés dès la première année, dont 40 % chez des nouveaux clients.

Avancée technologique : La série J90 offrait des systèmes évolutifs à un prix relativement bas dans des configurations à 8, 16 et 32 processeurs. Ces supercalculateurs avaient une bande passante 10 à 20 fois supérieure à celle des systèmes concurrents, pour un meilleur rapport prix/performance, car ils réduisaient la complexité des processeurs et utilisaient des puces CMOS (semi-conducteur à oxyde de métal complémentaire) avancées à bas prix et à haute vitesse. Le prix de ces systèmes débutait à 225 000 $.

Le Cray T90 en 1995.

Cray T90 – 1995

Fait marquant : Le système a fait l’objet de 8 précommandes avant son lancement officiel.

Petite anecdote : Le système T90 était le premier supercalculateur sans fil au monde. Cray avait éliminé tout le câblage interne à l’aide d’un appareil innovant qui connectait les modules de traitement à la mémoire. (À titre de comparaison, le plus gros système C90 renfermait 60 km de câbles.)

Avancée technologique : Héritière de la série C90, la série T90 à traitement vectoriel parallèle de Cray était disponible dans des configurations allant de 1 à 32 processeurs et offrait une puissance de 60 gigaflops. Ces supercalculateurs ne comportaient pas de câbles d’interconnexion, car ceux-ci étaient remplacés par des connecteurs eZIF (Zero Insertion Force) à activation électrique comportant chacun 400 contacts de signal.

Le Cray T3E en 1995.

Cray T3E – 1995

Premier client : Pittsburgh Supercomputing Center

Petite anecdote : Le Cray T3E était le premier supercalculateur au monde à atteindre 1 téraflops dans le cadre d’une application concrète. En 1997, les systèmes T3E détenaient 14 des 20 premières places dans le palmarès des meilleurs supercalculateurs au monde.

Avancée technologique : Le T3E n’avait pas d’équivalent capable de passer de quelques dizaines à plusieurs milliers de processeurs de manière efficace et économique. Ce qui le différenciait, c’est que chacun de ses éléments (module de communication entre les processeurs, système d’exploitation, I/O, mémoire) évoluait en fonction du nombre de processeurs.

La série Cray SV1 en 1998.

Série Cray SV1 – 1998

Premier client : Alabama Supercomputer Authority

Petite anecdote : Ford Motor Company a acheté 5 supercalculateurs Cray SV1, devenant ainsi le client numéro 1 pour ces systèmes.

Avancée technologique : Le système vectoriel évolutif de la série SV1 reposait sur des processeurs d’une puissance maximale de 4 gigaflops, sur des nœuds d’armoire unique d’une puissance maximale de 32 gigaflops et sur des outils de clustérisation de système. La combinaison de ces éléments a permis de produire un supercalculateur offrant une puissance de 1 téraflops. Ces supercalculateurs présentaient des innovations telles que la première mémoire cache vectorielle au monde. Ils affichaient en outre un rapport prix/performance 8 fois plus avantageux que celui leurs concurrents.

Le Cray X1/X1E en 2002.

Cray X1/X1E – 2002

Premier client : Département de la Défense des États-Unis

Petite anecdote : Les processeurs des supercalculateurs Cray X1 chauffaient tellement que les ingénieurs de Cray ont développé une technologie de refroidissement par pulvérisation innovante pour empêcher la surchauffe des modules.

Avancée technologique : Le système Cray X1 a associé les performances de traitement des systèmes vectoriels à l’évolutivité du traitement massivement parallèle, une prouesse longtemps jugée impossible. Des sous-systèmes d’interconnexion et de mémoire ultra-performants ont permis à ce système d’intégrer jusqu’à 4 096 processeurs et d’offrir une puissance de pointe de 50 téraflops. Mise à niveau majeure, le système X1E a triplé les performances de pointe et la densité de calcul de cette série.

Série Cray XT en 2004.

Série Cray XT – 2004

Premier client : Sandia National Laboratories

Petite anecdote : Cray a franchi la barrière du pétaflops avec le système XT5 (« Jaguar ») de l’Oak Ridge National Laboratory (voir photo). Jaguar comptait 200 armoires et 224 256 cœurs de traitement pour une puissance de 1,759 pétaflops, ce qui a fait de lui le supercalculateur le plus rapide du monde de 2009 à 2010. 

Avancée technologique : Cray a développé la technologie qui allait donner naissance à la série Cray XT en partenariat avec Sandia National Laboratories. Ce système massivement parallèle utilisait un système d’interconnexion conçu par Cray, était refroidi par air et pouvait évoluer d’une seule armoire à plusieurs centaines.

Le Cray XMT en 2006.

Cray XMT – 2006

Premier client : Pacific Northwest National Laboratory (PNNL)

Petite anecdote : Un chercheur du Georgia Institute of Technology a utilisé le système Cray XMT du PNNL pour identifier les utilisateurs les plus influents de Twitter en 2009. La machine a disséqué en une heure l’équivalent d’une journée de tweets provenant de quelque 18 millions d’utilisateurs.

Avancée technologique : Le système Cray XMT était une plateforme évolutive et massivement multithread dotée d’une architecture de mémoire partagée idéalement adaptée aux applications d’analyse et d’exploration de données à grande échelle. Il était conçu sur la base d’une lame de calcul Cray XT mais utilisait des puces Cray Threadstorm personnalisées. Un seul processeur Threadstorm pouvait prendre en charge 128 threads simultanés.

Les années 2010 : à la conquête du Big Data

Le Cray XE6 en 2010.

Cray XE6 – 2010

Fait marquant : Le Centre suisse de calcul scientifique (CSCS) a reçu le premier système bêta.

Petite anecdote : Les scientifiques qui utilisaient le système Cray XE6 ont trouvé la réponse à une énigme vieille de 300 ans : pourquoi le pôle magnétique terrestre se déplace-t-il constamment vers l’Ouest ? Indice : la réponse est liée au noyau.

Avancée technologique : Le supercalculateur XE6 reprenait l’infrastructure de la série XT en y intégrant des processeurs AMD et le système d’interconnexion révolutionnaire Cray Gemini. Gemini améliorait considérablement la vitesse de transmission des messages et la latence. Le XE6 était capable de s’étendre à plus d’un million de cœurs de processeur et de dépasser les 10 pétaflops.

La série Cray XK en 2011.

Série Cray XK – 2011

Premier client : Centre suisse de calcul scientifique

Petite anecdote : Le système Cray XK «∘Titan∘» de l’Oak Ridge National Laboratory (voir photo) était le plus rapide au monde en 2012. Il est resté sur la liste de 10 systèmes les plus rapides durant les 7 années suivantes. En 2019, c’est le système Cray Shasta «∘Frontier∘» qui succédait à Titan à l’ORNL.

Avancée technologique : La série Cray XK a associé le système d’interconnexion Cray Gemini, les processeurs scalaires multicœurs AMD et les GPU multicœurs NVIDIA pour créer un véritable supercalculateur hybride. Ce système était capable de s’étendre jusqu’à 500 000 processeurs et de dépasser les 30 pétaflops.

La série Cray XC en 2012.

Série Cray XC – 2012

Premier client : Centre de calcul haute performance de Stuttgart (photo)

Petite anecdote : Déployé en 2016, le supercalculateur XC50 pouvait livrer une puissance de pointe de 1 pétaflops dans une seule armoire. En comparaison, le premier système Cray à passer la barrière des pétaflops comportait 200 armoires.

Avancée technologique : Capables d’atteindre 500 pétaflops, les systèmes Cray XC alliaient traitement scalaire, cotraitement et technologie d’accélération dans une seule et même machine hautement évolutive. Ils ont également introduit le système d’interconnexion Cray Aries, qui a apporté des améliorations considérables sur l’ensemble des indicateurs de performance et a permis de relever le défi d’une bande passante globale évolutive et à coût maîtrisé.

Les plateformes Cray Urika en 2012.

Plateformes Cray Urika – 2012

Fait marquant : La première plateforme Cray Urika a compté plusieurs utilisateurs précoces, dont l’Institute of Systems Biology, la Mayo Clinic, Noblis et le Centre suisse de calcul scientifique.

Petite anecdote : Urika s’écrivait au départ uRiKA, pour « universal RDF integration Knowledge Appliance ».

Avancée technologique : La première plateforme Urika a été conçue en vue d’adopter une approche fondée sur des graphes pour l’analyse des relations dans le Big Data. Elle utilisait les processeurs massivement multithread Cray Threadstorm ainsi qu’une architecture de mémoire partagée massive. Plus tard rebaptisée Urika-GD, elle a été complétée par les plateformes d’analytique extrême Urika-XA et d’analytique agile Urika-GX.

La série Cray CS en 2013.

Série Cray CS – 2013

Fait marquant : Le Railway Technical Research Institute a été le premier client officiel de la série CS.

Petite anecdote : Quel est le point commun entre Shadow, Ollie, BeBop et Nurion ? Indice : ce ne sont pas des animaux de compagnie. Ils font partie des systèmes de la série CS qui ont figuré dans le classement TOP500 des supercalculateurs. Nurion s’est hissé jusqu’à la onzième place en 2018.

Avancée technologique : Les supercalculateurs en cluster de la série Cray CS intégraient les toutes dernières technologies de traitement, de réseau et de refroidissement tout en étant hautement personnalisables pour les charges de travail de calcul, de données et hybrides. Dernier modèle de la série, le système CS500 était capable de dépasser les 60 pétaflops.

Le Cray CS-Storm en 2014.

Cray CS-Storm – 2014

Premier client : Gouvernement des États-Unis

Petite anecdote : Lorsque le système Cray CS-Storm a été lancé en 2014, il était le système GPU le plus dense du monde.

Avancée technologique : Basé sur l’architecture de la série CS, le supercalculateur CS-Storm a été conçu pour les charges de travail accélérées par GPU. Un unique rack à haute densité affichait des performances à double précision qui pouvaient atteindre 980 téraflops. Ce système était bien adapté pour accélérer les charges de travail de calcul telles que les tâches de machine learning et de deep learning, de simulation de réservoirs et d’intelligence géospatiale.

Le système HPE Cray EX en 2018.

HPE Cray EX – 2018

Premier client : Argonne National Laboratory

Petite anecdote : Un supercalculateur exascale Cray de HPE est 6 milliards de fois plus rapide que le Cray-1.

Avancée technologique : Le supercalculateur Cray de HPE est conçu pour les charges de travail de l’ère de l’exascale. Il prend en charge diverses technologies de traitement, ainsi que les charges de travail convergées, élimine la distinction entre supercalculateurs et clusters, et fusionne les charges de travail de calcul haute performance et d’intelligence artificielle avec la productivité du cloud. L’interconnexion révolutionnaire HPE Slingshot en constitue le backbone. Les trois premiers supercalculateurs exascale des États-Unis sont tous des systèmes HPE Cray.