「加速生產性 AI 的效能」技術白皮書

  • 技術白皮書 (僅提供英文版本)
  • PDF 2037 KB
  • 15 頁

概觀

瞭解高效能運算 (HPC) 儲存裝置的需求,以便透過分散式 AI 伺服器加速生產性 AI 環境的效能。此白皮書列出了依據各種基準標準,在 1 到 32 個 GPU 的多達 4 個伺服器節點上使用快閃型 WekaIO 儲存裝置進行測試所得到的測試結果。瞭解在 GPU 數量相同的情況下,單一伺服器和叢集配置相比的 GPU 效能,以及 GPU 從 1 個擴充到 32 個時的 GPU 效能。瞭解 Resnet50、VGG16 和 Inceptionv4 等常見基準對儲存頻寬和輸送量的需求。此白皮書中的資訊可協助您規劃和最佳化生產性 AI 的 AI 資源。

閱讀本白皮書,瞭解儲存裝置 I/O 對於 DL 工作流程訓練部分,以及分散式 AI 運算叢集內訓練模式驗證推論的影響。