ML/DL環境で使用する大規模なモデルトレーニング向けのターンキーソリューションをお探しですか。HPE Machine Learning Development Systemは、標準化された検証済みかつ事前構成済みのソリューションで、IT環境の複雑さを軽減し、導入後すぐに使用できるため、モデルトレーニングに時間とリソースを集中させることができます。分散型ML/DLモデルトレーニング向けのプラットフォーム (HPE Machine Learning Development Environmentソフトウェア) が含まれ、標準化された構成可能なAIクラスタ向けのHPEハードウェアインフラストラクチャ (HPE Apollo 6500 Gen10 Plus) と統合されているため、高精度な大規模モデルを迅速に構築できます。エクサスケールコンピューティング向けに構築されたこれらのシステムは、最大8個の強力なNVIDIA® A100 Tensor Core GPUをサポートし、分散ファイルシステムを構築するための高速のローカルソリッドステートドライブ (SSD) を搭載しています。HPE Machine Learning Development Systemは、Mellanox® InfiniBand HDR Iスイッチを介して接続することで、分散型ML/DLトレーニングに最適な高速かつ低レイテンシのInfiniBandネットワークを構築できます。

最新情報

  • GPUコストの管理をサポートする、機械学習 (ML) モデルトレーニングを大規模に実行するためのターンキーソリューション。
  • 導入後すぐに使用できるため、高精度のモデルを大規模にトレーニングするための時間を短縮できます。
  • 単一ポータルからの監視で、MLチームのコラボレーションを高めます。
  • ハードウェア、ソフトウェア、サービスが統合されているため、すぐに本稼働でき、大規模な運用に対応します。
  • 異種アクセラレータに対応する柔軟なAIインフラストラクチャ。

機能

大規模なMLモデルトレーニング向けのソリューションを提供

HPE Machine Learning Development Systemは、ハードウェア、ソフトウェア、ネットワーク、GPU、サービスが事前構成済みの完全なシステムであるため、ユーザーは専門知識をAIインフラストラクチャの管理ではなく、モデルの開発とトレーニングに集中して使用し、ビジネス課題を解決することができます。

この完全なシステムは、初日から運用可能であるため、MLモデルトレーニングに関連する複雑さとコストの両方を削減することができます。

ユーザーのスキルをモデルの開発とトレーニングに活用できるHPE Machine Learning Development Systemは、高いスキルを持つスタッフをITおよびインフラストラクチャの管理業務から解放します。

AIインフラストラクチャを効率的に管理

HPE Machine Learning Development Systemは、AIインフラストラクチャとモデルメトリクスを一元管理のもとで監視できます。

HPE Machine Learning Development Systemを使用することで、アクセラレータを使用し、柔軟なストレージオプションを提供する異種混在の基盤を構築し、現在と将来のAI環境のニーズに対応することができます。

AIインフラストラクチャの稼働率とモデルレポートの効率化を向上させるとともに、MLチーム間のコラボレーションを促進します。

  • Linuxは、米国およびその他の国におけるLinus Torvaldsの登録商標です。NVIDIAは、米国およびその他の国におけるNVIDIA Corporationの商標および/または登録商標です。Red Hatは、米国およびその他の国におけるRed Hat, Inc.の登録商標です。すべての第三者の商標は、それぞれの所有者に帰属します。