HPE AI 工厂解决方案
客户可借助 HPE 提供的总包式或精选验证的 AI 工厂解决方案套件,更快速地实现 AI 目标,并在任意规模下完成从原始数据到智能、再从智能到深度洞察的转化流程。
快速、高效、大规模地将 AI 从试点阶段推向生产阶段
多租户对于大规模部署 AI 工厂至关重要。HPE 集成平台提供齐全的多租户功能,包括 GPU 租户、自动化和自助服务、自动化资源监控和计费,以及向各个租户提供增值服务。
在整个 AI 生命周期中大规模实施 AI
能够从几十个 GPU 扩展到几万个 GPU,从而实现可扩展的 AI 运维,并内置编排、可观察性和生命周期自动化功能。
可观察性和控制
规模化和自主 AI 工厂包含一个控制平面,可实时观察和管理整个系统,包括数据沿袭、模型行为、策略执行和系统运行状况。
主权、安全性与合规性
AI 工厂解决方案能够全面管控其敏感数据,同时满足产品主权合规性和解决方案合规性支持要求。
全栈多租户模式
告别资源噪声与数据窥探难题,为 AI 工作负载提供本地部署模式下的类 GPU 云服务体验,同时实现租户级的独立计量、监控、计费与资源配置。
通过 AI 工厂解决方案加速实现价值
企业、服务提供商、政府、研究机构和公共部门实体可以通过任何规模的 AI 工厂解决方案更快地获得 AI 投资回报 (ROI)。
| 主权 AI 工厂 | 规模化 AI 工厂 | 总包式 AI 工厂 | |
|---|---|---|---|
| 描述 | 主权 AI 工厂为特定管辖范围内的主权实体提供关键数据集、技术、专业知识、编排及基础设施的访问权限。在整个 AI 生命周期中,以人口规模提供安全性、合规性和控制力。 | 大规模 AI 工厂包含了从 AI 规划到 AI 开发和部署快速过渡所需的一切。硬件、软件、服务、控制平面、网络、开源组件和加速器均已通过工程验证,随时可为 AI 提供高效生产力。 | 该工程解决方案为整个 AI 生命周期提供了一个安全且随时可用的专用平台,从数据准备和大型语言模型 (LLM) 训练到调优和推理,全部基于单个 SKU。 |
| 非常适合 | 政府、公共部门、研究机构、金融机构 | 大型企业、服务提供商 | 企业希望在整个组织内快速扩展和加速 AI 计划 |
| AI 生命周期的各个阶段 | 从开发到训练、调优、推理和监控的整个生命周期 | 从开发到训练、调优、推理和监控的整个生命周期 | 整个 AI 生命周期 |
| 大小 | 数百至数万个 GPU | 数百至数万个 GPU | 最多可支持 64 个 GPU |
| 差异化优势 | HPE 提供主权 AI 系统作为可定制的 HPC/AI 解决方案,旨在提供对边界内数据和技术的控制。 与竞争对手的解决方案不同,HPE 软件提供整体软件,因此更容易查看和控制您的环境。HPE Sovereign AI 解决方案已经过验证,采用模块化设计,并预先集成完整的技术堆栈,可加快客户实现 AI 价值的速度。 | 规模化 AI 工厂凭借其全面的解决方案,在整个 AI 生命周期中实施 AI,从而在竞争中脱颖而出。
|
|
| 用例 | 模型训练、GenAI 即服务、计算机视觉、推理即服务、聊天机器人和智能助手、代理 AI | 模型训练、GenAI 即服务、计算机视觉、推理即服务、聊天机器人和智能助手、代理 AI | 生成式 AI、代理 AI、传统 AI、物理 AI、多模态、计算机视觉 |
| 冷却 | 直接液冷与风冷 | 直接液冷与风冷 | 风冷 |
| 多租户 | 针对每一层硬性多租户架构的设计 | 名副其实的全栈多租户模式 | 企业多租户 |
| 软件 |
|
|
|
| 合规性 |
| 标准企业合规性 | 内置的跨堆栈自动合规性 |
| 可观察性 |
|
|
|
| 安全性 |
| 贯穿整个堆栈的企业安全保护 | 整个堆栈内置自动化零接触安全功能 |
| 产品主权 | 可以 | 不适用 | 可提供隔离式选项 |
| 解决方案主权 | 系统级合规性,包括集成、流程和操作实践 | 不适用 | 通过 NVIDIA 强化型 NIM 实现 STIG-FIPS 标准 |
| 运营主权 |
| 不适用 | 不适用 |
| 风险管理 | 是 | 是 | 是 |