読了時間: 4分 | 公開日: 2025年3月3日

AIスーパーコンピューティング
AIスーパーコンピューティングとは

AIスーパーコンピューティングとは、人工知能 (AI) モデルを採用し、数十万台の強力なマシンで構成された超高速プロセッサーを使用して膨大な量のデータを管理および解釈することです。

サーバールームでコンピューターを使用している技術者たち。
  • AIスーパーコンピューターの仕組み
  • AIスーパーコンピューティングと分析ワークロード
  • AIスーパーコンピュータの例
  • HPEとAIスーパーコンピューティング
AIスーパーコンピューターの仕組み

AIスーパーコンピューターの仕組み

AIスーパーコンピューターは通常、数十万個のプロセッサー、専用ネットワーク、膨大なストレージ容量などからなる微調整済みのハードウェア群で構成されます。

スーパーコンピューターはワークロードを分割して複数のプロセッサーに割り当て、各プロセッサーに作業を分担させます。プロセッサーは担当作業を実行する際に、他のプロセッサーと頻繁にやりとりします。各プロセッサーは通信グリッドを介してメッセージを送信し、問題に応じて、上下左右や前後などのさまざまな次元で情報が交換されます。この多次元プロセスは、互いに対してワークロードを適切に調整し、処理速度を向上させるのに役立ちます。

意外なことに、AIスーパーコンピューターが運用しているのは、Linuxソフトウェアでアプリケーション、ネットワーク、スケジューリングを実行するごく普通のオペレーティングシステムです。実行される分析プログラムはCまたはFortranで書かれることが多く、複数のマシンで使用できるMPIと呼ばれる通信ライブラリを介してメッセージを渡します。

回路基板に小型回路が高密度に実装されたAIスーパーコンピューターは高速化できる一方で、発熱量も大きくなります。これは、チップに必要な電力を出し入れする技術がまだ十分に効率化されていないため、チップが非常に高温になることが原因です。しかし、何十万ものマルチコアノードを組み合わせたスーパーコンピューターでは、膨大な冷却が必要になります。これを緩和するために、回路は銅線で作られています。銅線は非常に高い電力密度でエネルギーを伝送できるからです。スーパーコンピューターは、強制空冷を利用して熱を放散させ、システム全体に冷媒も循環させています。

AIスーパーコンピューティングと分析ワークロード

AIスーパーコンピューティングが分析ワークロードに対応する方法とは

AIスーパーコンピューターが複雑な分析ワークロードに対応できる理由は複数あります。

ノード
AIスーパーコンピューターには複数のCPUが搭載されており、非常に高速な計算速度を実現します。これらのCPU (ノード) 内には、タスクを実行するためのコアが10~12個あります。また、スーパーコンピューターはそのアーキテクチャーで数千ノードをクラスター化することが多く、1,000ノードあたり12,000コアが動作していることになります。つまり、1台のスーパーコンピューターに1000ノードあるだけで、その処理性能は数兆サイクル/秒になります。

回路
配線接続も非常に小さいため、従来のコンピューターの回路基板よりも多くの電力を回路基板に詰め込むことができます。これら2つの進歩により、複雑な算術演算と論理演算を順番に解釈して実行することが可能となっています。

処理
また、スーパーコンピューターでは、複数のワークロードを同時に実行できるよう並列処理を採用しています。具体的には、数千タスクが同時処理されるため、作業は数ミリ秒単位で完了します。AIスーパーコンピュータにより、各業界ではより大規模、より有能、より高精度のモデルをトレーニングできるようになります。精度が高まると、各チームが情報分析を高速化し、重要な学習結果をプロセスに反映させ、より多くの情報源を活用してより多くのシナリオをテストできます。それらすべての結果として、業界の進歩が加速します。

AIスーパーコンピュータの例

AIスーパーコンピュータの例

NVIDIA DGX SuperPOD: NVIDIAが設計したハイパフォーマンスAIスーパーコンピューターです。AIの研究開発に並外れた計算能力を提供するために相互接続された複数のNVIDIA DGXシステムで構成されます。DGX SuperPODは大規模AIモデルのトレーニング、高度なシミュレーションの実行、さまざまなディープラーニングタスクの高速化に使用されます。

Summit: 米国オークリッジ国立研究所に設置されたIBMとHPEの共同開発のSummitは世界最速レベルのスーパーコンピューターです。AI機能とハイパフォーマンスコンピューティング (HPC) を統合して科学研究を加速させます。IBM POWER9 CPUとNVIDIA Tesla V100 GPUを使用するため、Summitはディープラーニングやデータ分析などのAIワークロードに非常に効率的です。

富岳: 富岳は理化学研究所と富士通が開発した日本製スーパーコンピューターです。理化学研究所計算科学研究センターに設置され、世界最速クラスのスーパーコンピューターとして認められています。富岳はAIや機械学習など幅広いアプリケーションに対応できるように設計されました。そのアーキテクチャーにより、画像認識、自然言語処理、その他のAI駆動型シミュレーションなどのタスクを高速に実行できます。

以上のAIスーパーコンピューター群は、その膨大な計算能力により、科学研究から産業用アプリケーションまで、さまざまな分野の進歩にきわめて重要な役割を果たします。

HPEとAIスーパーコンピューティング

HPEとAIスーパーコンピューティング

HPEは幅広いワークロードとスケールの要件に対応できるHPC/AIソリューションをご用意しました。HPEの各種ソリューションはHPC/AIワークロード向けの包括的なモジュール型ソフトウェアポートフォリオの一部をなします。大規模なHPC/AIのアプリケーションとパフォーマンスに最適化され、高性能CPUおよびGPUのサポートに必要な密度と信頼性を備えました。

さらに、HPEが提供する大規模デプロイに対応可能なHPCハードウェアはどんな規模のデプロイにもフル統合され、高密度プラットフォーム向けの高度な冷却オプションを搭載します。

画期的な機能を持つHPE Crayスーパーコンピューターは、スーパーコンピューティングへのまったく新しいアプローチです。その設計では、数万から数十万のノードに最適なソリューションを提供するためにインフラストラクチャを選択できます。高密度の8ウェイGPUサーバーは予測可能性と信頼性が高く安定したパフォーマンスを提供するため、大規模なワークフローでも高い生産性を実現します。SlingshotインターコネクトとCrayソフトウェアによってクラウドライクなユーザーエクスペリエンスが実現し、HPE Performance Cluster Managerによって包括的なシステム管理が可能になります。

関連する製品、ソリューション、サービス

スーパーコンピューティング

世界を一変させるイノベーションおよびエクサスケール時代のはるか先の未来の発見を応援

関連トピック

人工知能 (AI)

スーパーコンピューティング

機械学習