増え続けるユーザーのニーズに対応すると同時に、拡大を続けるクラスターを管理できる、エンタープライズレベルのセキュリティを備えた信頼性の高いソフトウェアソリューションをお探しですか。HPE Performance Cluster Managerは、ノードを10万台までスケールアップできるLinux®ベースのハイパフォーマンスコンピューティング (HPC) クラスターをサポートする、完全統合型のシステム管理ソリューションです。このソフトウェアを使用すれば、短時間でベアメタルのシステムをセットアップし、包括的なハードウェアの監視と管理、イメージ管理、ソフトウェアアップデート、および電力管理を実現できます。HPE Performance Cluster Managerは、HPCシステムの管理に費やす時間とリソースを削減することにより、総所有コストを低減し、生産性とハードウェアの投資収益率を向上させます。

最新情報

  • HPE HPCシステムのサポート: HPE Apollo、HPE SGI 8600、HPE ProLiant DLサーバー、およびHPE Moonshot。

機能

迅速なクラスターのプロビジョニングと高い運用性

HPE Performance Cluster Managerなら、数千台のノードを含むベアメタルのクラスターにLinuxオペレーティングシステムを迅速に (通常は1時間以内に) プロビジョニングできます。

システムをシャットダウンしなくても、後からクラスターに追加したものを含む、クラスター内のハードウェアコンポーネントの検出と構成が自動的に行われます。[1]

システム管理者とエンドユーザーの機能が個別に維持され、中央のレポジトリに認証済みのシステムの構成情報が保存されます。これらは、HPCシステムのセキュリティ侵害のリスクを軽減するのに役立つソフトウェア機能の一例にすぎません。

包括的なシステムの監視と管理

HPE Performance Cluster Managerは、ハードウェアシステム、環境、パフォーマンス、および電源の評価基準を収集し、管理者がグラフィカルユーザーインターフェイス (GUI)、Webブラウザー、またはコマンドラインインターフェイス (CLI) でデータを確認できるようにします。

システム管理者は、管理コンソールから、またはCLIを介して任意のノードセットに管理コマンド (プロビジョニング、リブート、シャットダウン、電源オフなど) を送信できます。

継続的にシステムを監視する中で生成されたシステムアラートが管理コンソールに表示され、システム管理者にメールで送信されます。このアラートには必要な対応に関する情報が含まれているため、ユーザーは重要なイベントに対する自動応答を追加することが可能です。

構成の一貫性を維持するために、ユーザーは任意のノードセットで同じコマンドを実行し、すぐに相違や不一致を確認できます。

Redfish、IPMI、SNMPなどのアウトオブバンド管理プロトコルがサポートされているため、他のハードウェアツールやソフトウェアツールとの統合が可能です。

ソフトウェアアップデートで幅広い要件に対応

HPE Performance Cluster Managerを使用した場合、プロビジョニング後にシステムを再起動する必要がありません。ネットワーク通信によってプロビジョニングが中断することはなく、システム管理者が操作しなくても再施行が自動的に行われます。

HPE Performance Cluster Managerは、ユーザーがクラスター全体、または選択したノードで複数バージョンのLinuxオペレーティングシステムをインストールし、さまざまなワークロードに対応できるようにすることで柔軟性を向上させます。

包括的なイメージ管理により、ユーザーはソフトウェアのイメージレポジトリを作成して維持し、必要に応じて簡単にソフトウェア環境を構築したり、切り替えたり、リストアしたりできます。バージョンコントロールにより、必要に応じてソフトウェアの変更をロールフォワード、またはロールバックすることが可能になり、アカウンタビリティのために変更が記録されます。

高度な電力管理で運用コストを削減

HPE Performance Cluster Managerは、電力使用量を正確に測定して予測し、より的確なキャパシティプランニングを可能にするツールを提供します。

システム管理者は、システムの温度超過を防止したり、電力消費量が制限値を超えないようにしたりするために、あるいは (ワークロード、計画停電、時刻といった) その他の理由で電力消費量の上限を設定できます。また、空冷機能の障害が発生した場合に一時的に電力を制限することも可能です。

ワークロードスケジューラーツールで電力リソース用のAPIを使用することにより、ジョブまたはユーザー単位での電力リソースの管理とアカウンティングが可能になります。

段階的なトポロジおよびプロトコル認識型の電源オン/オフ機能により、システムの起動を制御するとともに、障害に起因するインシデントを隔離してシステムを迅速にリカバリできます。

  • 1.
    HPE SGI 8600システムで使用可能。
  • Linuxは、米国およびその他の国におけるLinus Torvalds氏の登録商標です。その他すべての第三者の商標は、それぞれの所有者に帰属します。