好奇心から始まったスーパーコンピューティングの歴史

Crayスーパーコンピューターの歴史。

Crayスーパーコンピューター「Frontier」。
Seymour Crayのポートレート。

不可能を可能に変える

スーパーコンピューティングの歴史は1人の人物のビジョンから始まりました。Seymour Crayは、コンピューターの設計技術や、回路と配線から速度を引き出すことに高い関心を持ち、それらを無駄なく洗練された操作で行うことに熱心に取り組んでいました。

Crayは、1972年にCray Research社を設立し、世界最速のコンピューティングシステムを実現するというビジョンの達成を目指しました。彼は何度も挫折を経験しましたが、それでも開発を続けました。

彼のビジョンと少人数のエンジニアグループによって、Cray-1スーパーコンピューターが誕生したのです。エンジニアリングの傑作であるCray-1は、処理能力から冷却機能、パッケージングに至る優れた性能によって、それまでのコンピュートテクノロジーを一変させ、Crayの名前とその功績を歴史に刻みました。

Cray-1からHPE Crayまでの歩み

​Cray Research社の設立当初の使命は、業界最速のコンピューターを構築し、科学向けの大規模コンピューティングの業界をリードすることでした。しかし、システムが社会にもたらす可能性を知るにつれ、その使命は拡大していきました。スピードを追い求めるだけではなく、世界をより安全に、より健全に、よりスマートにするために、科学的および産業的問題の解決に貢献するという新たな使命が加わったのです。

HPEとSeymour Crayはそのビジョンを共有し、2019年、HPEがCrayを買収することにより、可能性に満ちたスーパーコンピューティングの新たな歴史が幕を開けました。

1970~1980年代: ​ギガFLOPSとガリウムヒ素に対する革新的な発想

Cray-1 - 1976年。

Cray-1 - 1976年

最初の顧客: ロスアラモス国立研究所 (写真)

興味深い事実: Cray-1は、1976年から1982年までの間、世界最速のスーパーコンピューターでした。その大きさは幅8.5フィート、高さ6.5フィートで、60マイルにも及ぶ配線を内蔵していました。

技術的背景 Cray Research社は、小型で円筒形状、1Mワードの半導体メモリ、64ビットのワードサイズ、最適化されたFortran Compiler、および「チェイニング」と呼ばれる技術によって、Cray-1の記録的な160メガFLOPSの性能を実現しました。

Cray X-MP - 1982年。

Cray X-MP - 1982年

最初の顧客: Digital Productions

興味深い事実: 映画会社であるDigital Productionsは、Cray X-MPシステムを使用してカルト映画の傑作「スター・ファイター」の画像を作成しました。この作品は、CG画像を世界で初めて使用した映画のひとつです。

技術的背景: ​Crayは、X-MPシステムで並列処理に移行し、システムに、クロックサイクルが​9.5ナノ秒の2つの共有メモリ並列ベクトルプロセッサーを搭載しました。​Crayは11バージョンのX-MPを製造しており、最速バージョンの最高速度は941メガFLOPSでした。

Cray-2 - 1985年。

Cray-2 - 1985年

最初の顧客: National Magnetic Fusion Energy Computer Center

興味深い事実: Cray-2スーパーコンピューターは「Bubbles」と呼ばれていました。液浸冷却を初めて採用したこのシステムは、回路が高熱になり液体が沸騰してしまうため、Seymour Crayは、その状態を全画面ディスプレイに表示し、沸騰した液体をガラスパネル越しに可視化できるようにしました。

技術的背景: Cray-2は、256M 64bitメモリ (コンピューターで利用できる中央メモリとしては最大) と4.1ナノ秒のクロック速度を備えた、4プロセッサーのベクトルアーキテクチャーで構築されました。Cray-2の最高処理速度は1.9ギガFLOPSです。

Cray Y-MP - 1988年。

Cray Y-MP - 1988年

最初の顧客: NASAエイムズ研究センター

興味深い事実: Cray Y-MPスーパーコンピューターは、1992年の映画「スニーカーズ」に登場しています。登場シーンでは、主役のベン・キングズレーとロバート・レッドフォードが、Cray Y-MPの上に座り、世界を変える方法について議論を交わしています。

技術的背景: Cray Y-MPは、世界初の1ギガFLOPSを超えたスーパーコンピューターです。​X-MPの後継機種である最初のY-MPシステムは、8つの並列ベクトルプロセッサー、​X-MPよりも高密度の回路、大容量の中央メモリを搭載していました。​Y-MPの最高処理速度は2.67ギガFLOPSです。

1990~2000年代: 変化と発展

Cray C90 - 1991年。

Cray C90 - 1991年

最初の顧客: ヨーロッパ中期予報センター

興味深い事実: Cray C90システムを民間で最初に導入したのがFord Motor Companyでした。

技術的背景: 当初、Cray Y-MP C90スーパーコンピューターと名付けられた、この並列ベクトルシステムは、それぞれ1ギガFLOPSの性能を備えた16基の新しいCPUと、2GBの中央メモリを搭載していました。Cray Y-MP C90は、これ以前のCrayの最速システムと比較して、5倍の処理速度を実現しています。そのアーキテクチャーの最も重要な特徴の1つは、各CPUがクロック周期ごとに機能単位ごとの2つのベクトル結果を提供できる、デュアルベクトルパイプラインでした。

Cray Y-MP EL - 1991年。

Cray Y-MP EL - 1991年

顧客に関する事実: ​初年度で55台の受注を獲得

興味深い事実: Cray Y-MP ELシステムは、Cray Research社が金融サービス業界および東欧で初めて販売したスーパーコンピューターです。

技術的背景: Y-MP ELスーパーコンピューターは、顧客の導入コスト削減を実現しました。システムは、最大4つのプロセッサーと1,042MBのメモリで構成でき、空冷式でコンパクト、かつ給電も容易に行えました。また、バランスの取れたメモリとI/O帯域幅を備えたY-MP ELは、その価格帯で利用可能な最高のスループットパフォーマンスを提供しました。Y-MP ELは、後にEL90シリーズへと発展しました。

Cray M90 - 1992年。

Cray M90 - 1992年

最初の顧客: AT&T Bell Labs

興味深い事実: Cray M90スーパーコンピューターは、その元のとなるY-MPシステムよりも、最大で125倍のメモリ容量の搭載を可能にしました。

技術的背景: Cray M90スーパーコンピューターシリーズ (当初はY-MP M90と呼ばれていた) は、Cray Y-MPシステムの大容量メモリバージョンです。DRAMテクノロジーを導入し、2、4、8プロセッサー構成と最大4Gワードメモリで提供されました。これにより、ユーザーは大規模な処理を分割して別々に実行することなく一括処理できるようになりました。

Cray T3D - 1993年。

Cray T3D - 1993年

最初の顧客: ピッツバーグスーパーコンピューティングセンター

興味深い事実: ​NASAのジェット推進研究所のミッションプランナーは、火星に宇宙船を着陸させるための最適な場所を探査するためにT3Dシステムを使用しました。

技術的背景: Cray T3Dスーパーコンピューターは、Cray初の大規模並列処理システムで、世界初の拡張性に優れた異機種混在システムです。Cray T3Dは、わずか26か月で設計、開発、製造、納入されました。T3Dは、Digital Equipment Corporationのマイクロプロセッサーの大規模並列アレイを、Crayが設計したベクトルプロセッサーに接続したもので、32から2,084のプロセッサーでの構成が可能でした。

Cray J90 - 1994年。

Cray J90 - 1994年

顧客に関する事実: 発表前に37件の事前受注を獲得

興味深い事実: J90シリーズは、初年度に170台以上の売上を達成したCrayで過去最速の販売実績を誇るシステムです。その顧客の40%は、Cray製品をこの時初めて購入しています。

技術的背景: J90シリーズは、8、16、32プロセッサー構成の拡張性に優れた低コストのシステムで、CPUの複雑さを軽減し、低コストで高速かつ高性能なCMOS (相補性金属酸化膜半導体) を使用することで、競合システムの10倍から20倍の帯域幅と優れたコストパフォーマンスを実現しました。システム価格は225,000ドルからです。

Cray T90 - 1995年。

Cray T90 - 1995年

顧客に関する事実: 発表前に8件の事前受注を獲得

興味深い事実: ​Cray T90システムは、世界初のワイヤレススーパーコンピューターです。Crayは、プロセッサーモジュールをメモリに接続する先駆的なデバイスを使用して、すべての内部配線を排除しました。(T90以前のシステムと比較すると、Crayで最大のC90システムは36マイルの配線を内蔵していました。)

技術的背景: C90システムの後継機種である並列ベクトル処理のT90シリーズは、1~32のプロセッサー数で、最大60ギガFLOPSの性能を実現しました。T90は、インターコネクトワイヤーを、それぞれ400個のシグナルコンタクトを備えたeZIF (electrically activated Zero Insertion Force) コネクターに置き換えました。

Cray T3E - 1995年。

Cray T3E - 1995年

最初の顧客: ピッツバーグスーパーコンピューティングセンター

興味深い事実: Cray T3Eは、実環境で1テラFLOPSを実現した世界初のスーパーコンピューターで、​1997年までに、世界のスーパーコンピューターのトップ20のうち14を占めました。

技術的背景: T3Eは、プロセッサー数を数十から数千にまで効率的かつコスト効率よく拡張できる点で他に類を見ない優れたシステムです。他システムと異なる点は、システムのあらゆる部分 (プロセッサー間通信、オペレーティングシステム、I/O、メモリなど) がプロセッサー数に応じて拡張されることです。

Cray SV1シリーズ - 1998年。

Cray SV1シリーズ - 1998年

最初の顧客: Alabama Supercomputer Authority

興味深い事実: Ford Motor CompanyはCray SV1スーパーコンピューターを5台購入し、このシステムで最大の顧客となりました。

技術的背景: SV1スケーラブルベクトルシステムは、最大パフォーマンスが4ギガFLOPSのプロセッサー、最大パフォーマンスが32ギガFLOPSのシングルキャビネットノード、および1テラFLOPSの性能を備えたスーパーコンピューターを構築するために組み合わされたシステムクラスタリングツールを備えていました。システムには世界初のベクトルキャッシュメモリなどの革新的なテクノロジーが導入され、価格性能比では、競合他社を8倍も上回っていました。

Cray X1/X1E - 2002年。

Cray X1/X1E - 2002年

最初の顧客: 米国国防総省

興味深い事実: Cray® X1プロセッサーは非常に高温で稼働していたため、エンジニアはモジュールの過熱を防ぐために蒸発スプレー技術を導入しました。

技術的背景: Cray X1システムは、ベクトルシステムのプロセッサーパフォーマンスと大規模並列処理のスケーラビリティを融合させました。この融合は画期的なもので、それまでは不可能と考えられていました。ハイパフォーマンスのインターコネクトおよびメモリサブシステムにより、X1システムは4,096プロセッサーまでの拡張性と、50テラFLOPSの最大パフォーマンスを実現しました。また、X1を大幅にアップグレードしたX1Eは、最大パフォーマンスとコンピュート密度がX1の3倍になりました。

Cray XTシリーズ - 2004年。

Cray XTシリーズ - 2004年

最初の顧客: サンディア国立研究所

興味深い事実: Crayはオークリッジ国立研究所のXT5システム「Jaguar」 (写真) でペタFLOPSの記録を塗り替えました。Jaguarは200のキャビネット、224,256のプロセッシングコアを備え、1.759ペタFLOPSの性能で2009年から2010年まで世界最速のシステムでした。

技術的背景: Crayはサンディア国立研究所と提携して、Cray® XT™ シリーズの技術を開発しました。Crayが設計したインターコネクトを使用する大規模並列型のXTは、空冷式で、1台のキャビネットから数百台まで拡張できました。

Cray XMT - 2006年。

Cray XMT - 2006年

最初の顧客: パシフィックノースウェスト国立研究所

興味深い事実: ジョージア工科大学の研究者は、パシフィックノースウェスト国立研究所のCray® XMT™ システムを使用して、2009年に最も影響力のあったTwitterユーザーを割り出しました。システムは、約1,800万人のユーザーからの1日分のツイートをわずか1時間で処理しました。

技術的背景: Cray XMTシステムは、大規模なデータ分析とデータマイニングに最適な共有メモリアーキテクチャーを備えた、スケーラブルで大規模なマルチスレッドプラットフォームです。その設計はCray XTコンピュートブレードをベースにしていましたが、Cray Threadstormのカスタムチップを使用していました。単一のThreadstormプロセッサーで、128の同時スレッドを維持できました。

2010年代: ビッグデータの活用

Cray XE6 - 2010年。

Cray XE6 - 2010年

顧客に関する事実: スイス国立スーパーコンピューティングセンター (CSCS) がシステムの最初のベータ版を使用しました。

興味深い事実: CSCSのCray® XE6™ システムを使用した科学者たちは、なぜ地球磁場が西に移動し続けるのかという300年来の謎を解明しました。「核」が謎を解く鍵だったのです。

技術的背景: XE6スーパーコンピューターはXTシリーズインフラストラクチャを採用し、マルチコアAMDプロセッサーと画期的なCray Geminiインターコネクトを搭載しました。​Cray Geminiは、大幅なメッセージレートの向上とレイテンシの改善を可能にしました。XE6は、100万を超えるプロセッサーコアに拡張可能で、10ペタFLOPSを超える性能を実現しました。

Cray XKシリーズ - 2011年。

Cray XKシリーズ - 2011年

最初の顧客: スイス国立スーパーコンピューティングセンター

興味深い事実: オークリッジ国立研究所で導入されたCray® XK™システム「Titan」 (写真) は、2012年に世界最速記録を更新し、その後7年間トップ10にランクインしていました。2019年、オークリッジ国立研究所は、Titanの後継システムとして導入したCray® Shasta™システムを「Frontier」と名付けました。

技術的背景: Cray XKシリーズは、Geminiインターコネクト、AMDマルチコアスカラープロセッサー、およびNVIDIAメニーコアGPUを組み合わせて、真のハイブリッドスーパーコンピューターを実現しました。このシステムは、500,000プロセッサーで30ペタFLOPSを超える性能に拡張することができました。

Cray XCシリーズ - 2012年。

Cray XCシリーズ - 2012年

最初の顧客: High Performance Computing Center Stuttgart (写真)

興味深い事実: ​2016年に発表されたXC50スーパーコンピューターは、シングルキャビネットで最大1ペタFLOPSのパフォーマンスを実現しました。XC50以前のシステムと比較すると、ペタFLOPSの記録を塗り替えたCray初のシステムは、200台のキャビネットを備えていました。

技術的背景: 500ペタFLOPSまで拡張可能なCray® XC™ システムは、スカラー処理、コプロセッシング、アクセラレータ技術を単一の拡張性の高いマシンに統合しました。また、Ariesのインターコネクトの導入により、すべての測定基準において大幅な改善を実現し、コストパフォーマンスに優れた、スケーラブルでグローバルな帯域幅を提供するという課題を解決しました。

Cray Urika Platforms - 2012年。

Cray Urika Platforms - 2012年

顧客に関する事実: 最初のCray® Urika® 製品を早期に導入した組織は、Institute of Systems Biology、メイヨークリニック、Noblis、スイス国立スーパーコンピューティングセンターなどです。

興味深い事実: Urikaは当初uRiKAと綴られていました。これは、Universal RDF Integration Knowledge Applianceを省略したものです。

技術的背景: 最初のUrika製品は、ビッグデータ関係分析へのグラフベースのアプローチ向けに構築され、Cray Threadstormの大規模なマルチスレッドプロセッサーと共有メモリアーキテクチャーを使用していました。後にUrika-GDと呼ばれるようになり、Urika-XA extreme analyticsとUrika-GX agile analyticsプラットフォームが加わりました。

Cray CSシリーズ - 2013年。

Cray CSシリーズ - 2013年

顧客に関する事実: 鉄道総合技術研究所はCSシリーズの導入を最初に公表した顧客です。

興味深い事実: Shadow、Ollie、BeBop、Nurionの共通点は何でしょうか。ヒント: 犬の名前ではありません。これらは、スーパーコンピューターのTOP500リストに掲載されているCSシリーズシステムの一部です。その中で、Nurionは2018年に11位にランクインされています。

技術的背景: Cray® CS™ シリーズクラスタースーパーコンピューターは、最新の処理、ネットワーキング、および冷却テクノロジーを備えており、コンピューティング、データ、およびハイブリッドワークロード向けに高度なカスタマイズも可能でした。シリーズの最終バージョンであるCS500システムは、60ペタFLOPS以上に拡張できました。

Cray CS-Storm - 2014年。

Cray CS-Storm - 2014年

最初の顧客: 米国政府

興味深い事実: 2014年に登場したCray® CS-Storm™ システムは、発売当時は世界で最も高密度のGPUシステムでした。

技術的背景: CSシリーズアーキテクチャーを基盤とする、CS-Stormスーパーコンピューターは、GPU高速化ワークロード向けに構築され、単一の高密度ラックで、最大980テラFLOPSの倍精度のパフォーマンスを実現しました。このシステムは、機械学習やディープラーニング、貯留層シミュレーション、地理空間情報などのコンピューティングワークロードを高速化するのに最適です。

HPE Cray EX - 2018年。

HPE Cray EX - 2018年

最初の顧客: アルゴンヌ国立研究所

興味深い事実: エクサスケールのHPE Crayスーパーコンピューターは、Cray-1よりも60億倍高速に演算処理ができます。

技術的背景: HPE Crayスーパーコンピューターは、エクサスケール時代のワークロードに対応するように構築されています。多様なプロセッサーテクノロジーとコンバージドワークロードをサポートし、スーパーコンピューターとクラスターの区別を排除し、HPCとAIのワークロードをクラウドの生産性と統合します。革新的なHPE Slingshotインターコネクトは、その基盤として機能します。米国で最初の3台となるエクサスケールスーパーコンピューターは、すべてHPE Crayシステムです。