本番環境AIのパフォーマンスを向上 - テクニカルホワイトペーパー

  • テクニカルホワイトペーパー
  • PDF 2037KB
  • 15ページ

概要

AIサーバーが分散している本番環境AIのシナリオでパフォーマンスを向上させるためのHPCストレージの要件について説明します。このホワイトペーパーには、フラッシュベースのWekaIOストレージを使用した、1~32のGPUが搭載された最大4つのサーバーノードの各種ベンチマークのテスト結果が記載されています。単一サーバーでのGPUのパフォーマンスと、同数のGPUを搭載したクラスター構成でのGPUのパフォーマンスを比較した結果に加えて、GPUのパフォーマンスを1 GPUから32 ...

AIサーバーが分散している本番環境AIのシナリオでパフォーマンスを向上させるためのHPCストレージの要件について説明します。このホワイトペーパーには、フラッシュベースのWekaIOストレージを使用した、1~32のGPUが搭載された最大4つのサーバーノードの各種ベンチマークのテスト結果が記載されています。単一サーバーでのGPUのパフォーマンスと、同数のGPUを搭載したクラスター構成でのGPUのパフォーマンスを比較した結果に加えて、GPUのパフォーマンスを1 GPUから32 GPUまで拡張する方法をご確認ください。Resnet50、VGG16、Inceptionv4などの一般的なベンチマークにおけるストレージの帯域幅およびスループットの要件を説明します。このホワイトペーパーには、本番環境AIのAIリソースの計画策定と最適化に役立つ情報が記載されています。

このホワイトペーパーでは、DLワークフローのトレーニング部分、および分散AIコンピューティングクラスター内のトレーニングモデル妥当性確認の推論に対して、ストレージI/Oが与える影響について説明します。