什么是云基础设施? 什么是云基础设施?
云基础设施是指通过互联网以即服务形式提供的硬件和软件组件集合,例如服务器、存储、网络和虚拟化资源。该组件集合能提供在云端构建、部署并管理应用和服务所需的基础技术与工具,从而为组织带来可扩展性、灵活性与成本效益。
阅读时长:11 分 20 秒 | 发布日期:2026 年 5 月 6 日
目录
云基础设施包括哪些要素?
云基础设施由多个关键构建模块构成,这些模块协同工作,通过互联网提供计算资源和服务,具体包括以下组件:
- 计算:CPU/GPU 和运行工作负载的实例。这些处理单元(如计算机或服务器)负责运行应用与服务。在云端,您可根据需求轻松扩展或缩减资源。
- 存储:提供不同性能层级的块存储、文件存储和对象存储服务。云存储支持通过多种方式存储和检索数据,例如文件、数据库或备份。您可根据实际需求选择存储类型和性能级别。
- 网络:VPC/VNet、负载均衡器、网关和 SDN。网络能安全地连接云资源,进而实现应用与用户之间的通信。虚拟网络、防火墙和负载均衡器则有助于管理流量并确保安全性。
- 虚拟化和容器:虚拟机监控程序、Docker 和 Kubernetes。虚拟化技术让您能够在单台物理服务器上运行多个虚拟机。容器则将应用打包,使其在任何环境中都能可靠运行,而 Kubernetes 则有助于管理和扩展容器。
- 编排与管理:资源调配、策略和自动化。编排是指自动管理并组织云资源。相关工具与策略有助于高效地配置、监控和调整资源。
- 身份与安全:IAM、MFA、KMS、加密和零信任。安全机制用于管控云资源的访问权限。身份和访问管理 (IAM)、多因素身份验证 (MFA) 和加密技术可有效保障数据和系统的安全。
- 数据保护和灾难恢复:备份、复制和故障转移。这些功能通过创建备份和副本来保护您的数据,以防发生故障或灾难,确保您的业务能够快速恢复。
- 可观察性:指标、日志记录、追踪和 AIOps。可观察性是指对云系统的运行状况和性能进行监控。相关工具会提供数据和警报,帮助您及早发现并解决故障。
- 自动化和基础设施即代码 (IaC):Terraform、流水线和 GitOps。自动化通过脚本和代码来配置和管理云资源,从而加快部署速度并减少人为错误。
- FinOps:规模调整、自动扩展、预留容量与成本分摊。FinOps 旨在管理云成本,通过调整资源规模、自动扩展、预留容量以及将成本分配至不同团队或项目,帮助优化云支出。
云基础设施在云计算中的作用是什么?
云基础设施是云计算的重要组成部分,为创建、部署和管理基于云的服务和应用提供了虚拟化、服务器、存储和网络等基本技术。云基础设施可按需提供计算资源并按使用量收费,因此提高了可扩展性、灵活性和经济性。它还通过冗余架构、资源分配和数据保护技术提高可靠性、性能和安全性。组织和个人均可以通过云基础设施使用可扩展、可靠且可访问的计算机资源,而无需投资硬件和基础设施。
云基础设施有哪些交付模式?
云基础设施可通过多种服务模式进行交付,每种模式在控制权、责任和便利性方面的权衡各不相同。主要有三种模式:
- 基础设施即服务 (IaaS)。IaaS 是一种云计算模式,服务商通过互联网提供服务器、存储、网络等虚拟化计算资源。在 IaaS 模式下,用户自行管理操作系统、应用和中间件,而云服务提供商负责维护底层硬件、虚拟化环境和网络基础设施。这使得企业无需购买或维护物理硬件,即可灵活、大规模地部署并管理 IT 基础设施。
- 平台即服务 (PaaS)。PaaS 在云基础设施的基础上,增加了开发工具、中间件、数据库和操作系统等托管服务。开发人员可以专注于应用程序的编写和部署,而 PaaS 提供商则负责底层基础设施和软件层的配置、扩展和维护。
- 软件即服务 (SaaS)。SaaS 位于最高层级,提供由云提供商托管和维护的全套软件解决方案。用户可通过网络浏览器或 API 访问电子邮件、协作工具、办公套件、CRM、HR 或 ERP 等各类应用,而无需安装、更新或进行本地管理。SaaS 充分利用了云基础设施的所有层级,使得软件只要有互联网连接便能随时随地进行访问。
云基础设施有哪些不同类型?
云基础设施分为多种类型,每种类型都针对特定的所有权模式、部署位置和业务需求而设计:
- 公有云基础设施。公有云基础设施归第三方提供商(如 AWS、Azure、Google Cloud)所有并运营,其运行位置为供应商管理的数据中心,可通过互联网进行访问。资源由多个用户共享,因此具有高度的可扩展性和成本效益。典型用例包括初创企业、需要快速扩展的企业,以及希望将 IT 运维工作外包的组织。
- 私有云基础设施。私有云基础设施专属于单一组织,可由内部管理或由第三方托管。其运行位置为本地或企业防火墙内,具有更强的控制力、定制化能力和安全性。非常适用于拥有严格合规性要求、敏感数据或对专业工作负载有机密性要求的组织。
- 混合云基础设施。混合云基础设施将公有云和私有云相结合,通过整合两种环境实现了更高的灵活性。它使组织能够将关键数据和工作负载保留在本地,同时利用公有云资源处理敏感度较低的需求或应对峰值需求。通常适用于希望优化资源、提升业务弹性,并能快速响应需求变化的企业。
- 多云基础设施。多云基础设施是指同时使用多个公有云服务提供商,其目的通常是为了避免供应商锁定,或利用不同平台的独特优势。其所有权归组织所有,但运行于多个外部数据中心。常见用例包括风险管理、冗余以及获取专业化的云服务。
- 边缘云基础设施。边缘云基础设施将计算资源分配到更接近数据生成或使用地点的位置(例如物联网设备、远程站点或本地数据中心)。其所有权归服务提供商或企业所有,运行于中央云数据中心外部。非常适合低延迟应用、实时数据处理以及远程运营支持等场景。
- 主权云基础设施。主权云基础设施旨在满足本地数据驻留、隐私与监管要求。它由国家或区域实体拥有并运营,运行于所在国家或地区境内。通常适用于政府、公共部门组织以及需要对数据位置和访问权限进行严格管控的受监管行业。
云基础设施与云架构对比
方面 | 云基础设施 | 云架构 |
|---|---|---|
| 定义 | 云基础设施包括用于通过互联网提供计算资源的物理和虚拟组件(如服务器、存储和网络),是云计算的基础。 | 云架构指云服务的设计和布局,它详细说明了各个组件如何交互和集成以满足特定需求,同时确保系统的可扩展性和性能。 |
| 重点 | 着重于提供计算资源所需的硬件和软件组件。 | 专注于云组件的整体设计、布局和互连,以实现特定的目标和功能。 |
| 组件 | 包括硬件、虚拟化、存储和网络组件。 | 包含各种架构元素,例如微服务、API、安全协议和集成策略。 |
| 目的 | 提供用于运行应用、存储数据以及通过互联网提供服务的基础和资源。 | 指导云解决方案的规划和设计,以满足特定的业务需求、性能要求和可扩展性目标。 |
| 可扩展性 | 促进可扩展性,实现根据需求动态分配资源。 | 定义云解决方案的扩展方式,确保架构能够适应不断变化的工作负载和需求。 |
| 实施 | 包含部署在数据中心的实际物理和虚拟基础设施。 | 包含在实际部署之前设计的概念和逻辑框架,重点关注不同组件将如何交互。 |
| 示例 | 硬件服务器、虚拟机、存储设备、网络设备。 | 应用组件、数据流图、安全协议和面向服务的架构。 |
什么是云基础设施架构?
云基础设施架构是指对计算、存储、网络和安全措施等云资源进行结构化设计与组织,以支持可扩展、安全且可靠的云运营。常见的架构模式包括:
- 着陆区。一个用于云采用和资源部署的安全、预配置环境。
- 中心-辐射网络。集中式网络与共享服务构成“中心”,隔离的工作负载构成“辐射”,以实现可扩展性与控制。
- 零信任:一种安全模型,无论访问请求源自何处,都会对其进行验证,以降低风险。
- 数据网格/湖仓一体。一种去中心化的数据管理和分析方法,可实现可扩展、灵活的数据访问。
- 安全隔离区。专为敏感工作负载或数据提供的隔离、受保护的环境。
- 混合连接。整合本地资源和云资源,以实现无缝运营。
如何为企业选择合适的云基础设施模型?
选择合适的云基础设施模型,取决于您组织的技术需求、合规要求及发展规划。评估以下几个关键因素,可帮助您判断哪种方案最能支撑您的工作负载、预算与长期战略:
- 评估安全和合规需求。明确您的监管要求、数据隐私关注点以及数据的敏感度。私有云或主权云可能更适合严格的合规需求。
- 明确工作负载需求。评估现有工作负载对高度定制化能力、性能表现和低延迟的需求。对于专业化或关键业务型工作负载,建议优先选择边缘云和私有云。
- 评估可扩展性需求。考虑您需要以多快的速度扩展或缩减资源。对于需要进行快速、灵活扩展的应用场景,公有云或混合云模型更为出色。
- 评估成本结构。将前期投入与即用即付定价模式和持续运营成本进行比较。公有云具有成本效益优势,而私有云的前期投入可能较高。
- 衡量 IT 管理能力。评估您的团队在基础设施管理与维护方面的能力。公有云可降低管理开销,而私有云则需要有一定的内部经验。
- 审查数据驻留与主权要求。确认您是否需要在特定地理边界内保存数据。主权云和本地云可帮助满足此类合规要求。
- 分析灾难恢复和业务连续性需求。确保所选模型支持备份、复制和故障转移策略。混合云和公有云通常都有内置的灾难恢复 (DR) 选项。
- 为未来增长和灵活扩展做好规划。选择一款能够适应业务需求和工作负载变化的模型。混合和多云在长期灵活性上更具优势。
- 征询利益相关方和专家的意见。邀请 IT、安全、财务和业务负责人参与决策,确保决策与业务目标保持一致。
转向云基础设施会带来哪些经济影响?
转向云基础设施会对企业的成本和运营产生显著影响。采用云技术使组织能够从大额的前期资本支出转向灵活、按使用量付费的成本模式。通过 FinOps 实践,企业可以借助资源合理配置、自动扩展和预留实例等策略来优化支出。增强的监控能力、AIOps(人工智能 IT 运维)和 SRE(站点可靠性工程)有助于减少停机时间、提高效率并可自动执行常规任务,从而节省运营成本。
云提供商还提供具有不同恢复点目标 (RPO) 和恢复时间目标 (RTO) 层级的灾难恢复 (DR) 解决方案,使企业能够选择适合自身需求的保护级别,而无需维护成本高昂的重复基础设施。
云基础设施如何增强灾难恢复能力和业务连续性?
云基础设施在保障企业业务弹性、抵御各类突发中断方面发挥着关键作用。借助远程可扩展资源,组织可有效保护关键数据、维持运营,并可在突发事件后更快地恢复系统运行。云基础设施还可简化恢复计划的管理与测试,使企业能够专注于核心业务,同时最大限度地减少停机时间。主要优势包括:
- 增强灾难恢复能力 (DR)。灵活的恢复选项、自动备份以及跨地理区域分布的数据中心可提升恢复能力。云定价模式能降低前期成本,且恢复计划的测试更为简便。无论是最小化恢复点目标 (RPO),还是达成恢复时间目标 (RTO),都变得更为快速、可靠。
- 提高业务连续性 (BC)。近乎实时的故障转移可确保业务运营持续进行,并将中断影响降至最低。员工可以远程访问系统,可扩展性能应对突发的需求高峰,服务提供商则负责物理安全和维护工作。最终带来的结果是:正常运行时间更长,业务环境更可靠。
云基础设施在安全方面需要重点关注哪些问题?
保护云基础设施需要深入理解责任共担模型,并重点关注数据、身份和网络层面的管控。从明确的边界向分布式环境的转变,使得零信任方法成为必然选择。
责任共担模型
- 信任的基础。安全是一项分工协作的任务:提供商(如 AWS、Azure、GCP)负责保护物理基础设施和虚拟机监控程序,而客户则负责云环境“内部”的全部资源,包括数据、操作系统和网络配置。
身份和访问管理 (IAM)
- 最小权限原则 (PoLP)。该策略严格将权限限制在执行任务所需的最低限度,以防止权限过高的帐户成为主要攻击途径。
- 强身份验证。对所有人工用户强制执行多因素认证 (MFA),并将程序化访问切换为临时安全凭证(例如 IAM 角色或短效令牌),以淘汰长期访问密钥。
- 服务间授权。使用托管身份或角色与云服务进行交互,以消除在应用代码中存储静态凭证这一“反模式”做法。
- 身份联合。通过使用 SAML 2.0 或 OIDC 等标准,将云 IAM 与企业提供商(如 Okta、AD)集成,以实现集中化的用户管理。
数据保护和加密
- 静态加密。利用 AES-256 加密算法保护对象存储或块存储中的敏感数据,并通过密钥管理服务 (KMS) 或硬件安全模块 (HSM) 进行管理。
- 传输中加密。通过确保内部及外部的所有通信均使用 TLS 1.2 或更高版本,从而保护数据的完整性。
- 数据丢失防御 (DLP)。通过部署自动化工具,对个人身份信息 (PII) 或敏感数据进行扫描、分类和保护,防止其在云服务中意外泄露。
网络与边界安全防护
- VPC 配置和分段。根据信任级别将应用隔离到特定的子网中,确保面向公众的资产与私有数据库在逻辑上相互隔离。
- 安全组和网络访问控制列表 (NACL)。通过部署有状态和无状态的虚拟防火墙,从而根据特定协议和端口严格管控入站和出站流量。
- Web 应用防火墙 (WAF) 与边界防御。通过使用 Web 应用防火墙,以缓解 SQL 注入、XSS 等边缘常见威胁。
- IDS/IPS 监控。通过部署云原生的入侵侦测和防御系统,以监控流量中的恶意模式和异常情况。
配置和漏洞管理
- 配置漂移管理。利用治理工具(如 AWS Config 或 Azure Policy)根据 CIS 基准对资源进行审核,并对不符合要求的资产进行自动修复。
- 镜像加固。通过使用预先打好补丁并移除了不必要服务的“黄金镜像”,实现部署标准化,从而缩小攻击面。
- 自动化漏洞扫描。持续扫描操作系统镜像、应用代码和容器,在已知的 CVE 被利用之前进行识别与修复。
HPE 云基础设施解决方案
HPE 提供广泛的云基础设施解决方案,可满足各种业务需求:
- HPE Aruba Networking Central:集中管理网络,确保整个企业范围内的效率和安全。
- Data Services Cloud Console (DSCC):集中管理和优化云资源。DSCC 与各项 GreenLake 服务(包括备份与恢复、文件存储和块存储)无缝协作,以提供一致的用户体验。
- GreenLake for Private Cloud Enterprise:将云计算的敏捷性和可扩展性与企业特定的本地基础设施相结合。
- GreenLake for Private Cloud Business Edition:利用灵活、经济高效且可靠的私有云解决方案加速创新和增长。
- GreenLake:采用消费型 IT 战略加速数字化转型,在不影响性能和控制力的前提下扩展规模。
- HPE 混合云:通过结合了本地基础设施和云服务的混合云架构,满足现代企业的动态需求。此解决方案利用无缝的本地基础设施和云服务来统一和优化 IT。
- HPE Application Modernization Services:将旧应用更新改造为云原生解决方案,以提升创新能力、效率并改善用户体验。
HPE Transformation Services—Edge-to-Cloud Modernization Program:提供战略性建议和帮助,将您的 IT 基础设施从边缘更新到云,以跨整个 IT 环境实现无缝集成和优化。
常见问题
云基础设施有何优势?
云基础设施具备多项关键优势,使其成为现代云计算环境的核心组成部分。它使企业能够按需获取计算、存储和网络资源,而无需购买或维护物理硬件。
最常见的优势包括:
- 成本效益。许多云服务提供商采用即用即付的定价模式,使企业能够避免巨额的前期基础设施投资。
- 可扩展性与灵活性。组织可根据工作负载变化、季节性需求或业务增长,即时扩展或缩减云基础设施资源。
- 可靠性和可用性。主流云服务提供商运营着全球分布的数据中心,这些数据中心旨在提升正常运行时间、提供内置的冗余保障和强大的安全控制。
这些功能共同助力企业提升敏捷性、降低 IT 开销,并加快应用部署速度。
云基础设施在云计算中的作用是什么?
云基础设施是云计算的基石。它可提供在云端运行应用与服务所需的核心资源。
这些基础资源包括:
- 计算:虚拟机和处理能力
- 存储:可扩展的数据存储系统
- 网络:实现应用、用户与服务之间的连接
这些组件为更高级别的云服务提供支撑,包括基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。因此,云基础设施作为底层"硬件支撑层",使企业能够构建、部署和扩展应用程序,而无需自行管理物理服务器。
容器和 Kubernetes 如何融入云基础设施?
容器和 Kubernetes 是现代云基础设施与原生云应用的核心技术。
1. 容器通常通过 Docker 等工具创建,它能将应用及其依赖项打包成轻量级、可移植的单元,这些单元可在不同环境中保持一致的运行状态。
2. Kubernetes 作为容器编排平台,负责对跨云基础设施资源集群的容器进行自动化部署、扩展和管理。
3. 在云环境中,Kubernetes 可帮助组织:
- 跨多个服务器运行容器化应用。
- 根据需求自动扩展工作负载。
- 通过自我修复和监控来维持应用的可靠性。
4. 这种架构使企业能够构建灵活、可移植的应用,并在公有云、私有云和混合云基础设施上高效运行。
如何从身份、网络、数据和合规性四个维度保障云基础设施的安全?
保护云基础设施需要对其环境的多个层面进行防护,包括身份、网络访问、数据保护和合规性。
各组织通常会实施以下几项核心安全实践:
- 身份和访问管理 (IAM)。IAM 工具强制执行最小权限原则,确保用户和应用仅能访问其所需的资源。
- 网络安全。虚拟私有云 (VPC)、防火墙和网络分段等技术可用于隔离工作负载并保护内部系统。
- 数据加密。敏感数据在静态和传输状态下均受到安全保护。
- 合规性监控。日志记录、审计和监控工具可帮助组织满足 SOC 2、HIPAA 和 GDPR 等合规性标准。
采用分层深度防护策略,有助于在保障云运营安全的同时有效降低风险。
如何通过 FinOps 估算和优化云基础设施的成本?
各组织通常使用一种名为 FinOps(云计算财务运营)的方法来管理云基础设施成本。FinOps 可帮助团队跟踪支出、预测用量,并持续优化云资源效率。
成本管理通常包括三项关键活动:
- 成本估算。企业利用云定价计算器和预测工具来估算计算、存储和网络资源的成本。
- 成本监控。团队通过跟踪云支出和资源利用情况,来识别低效问题或异常使用情况。
- 成本优化。常见的优化技术包括:合理调整工作负载规模、使用预留容量或节省计划,以及自动关停非生产环境。
这些实践有助于企业在最大限度地提高基础设施效率的同时,保持云支出的可预测性。
如何确保可用性、备份和灾难恢复?
可靠的云基础设施需要制定高可用性、备份和灾难恢复 (DR) 策略。
大多数云架构依赖于以下三项关键弹性实践:
- 高可用性。应用分布在多个可用区 (AZ) 中,即便某个数据中心发生故障,业务仍能持续运行。
- 备份与数据保护。自动快照、备份和复制功能确保重要业务数据能够快速恢复。
- 灾难恢复计划。组织会制定经过测试的恢复计划,以便在发生重大中断事件时,能够在其他云区域或环境中恢复工作负载。
这些功能共同帮助企业在服务中断期间保持正常运行时间并保护关键数据。
云基础设施如何支持 AI/ML 工作负载?
云基础设施是支持人工智能 (AI) 和机器学习 (ML) 工作负载的关键要素。AI 应用需要强大的计算能力和海量数据集。云服务提供商通过以下方式来支持这些工作负载:
- 专用计算硬件。按需提供 GPU 和 TPU,以加速模型训练和 AI 推理。
- 可扩展数据存储。云平台提供能够管理海量机器学习训练数据集的存储系统。
- 托管式 AI 服务。机器学习开发工具、模型部署服务等平台,可简化整个 AI 生命周期管理。
此类基础设施使组织无需投资昂贵的本地硬件,即可构建和部署 AI 应用。
衡量云基础设施成功的关键性能指标有哪些?
各组织通过多项关键性能指标 (KPI) 来评估云基础设施的性能,涵盖对可靠性、性能、成本效益和安全性等维度的评估。常见的云基础设施 KPI 包括:
- 可用性和可靠性。正常运行时间百分比和平均恢复时间 (MTTR) 等指标用于衡量系统的弹性。
- 性能。延迟、吞吐量、应用响应时间等指标反映了工作负载的运行效率。
- 成本效益。团队跟踪云支出、预算匹配情况和基础设施利用率。
- 安全态势。安全事件、漏洞修补时间和合规状况等指标有助于确保基础设施始终处于安全状态。
这些 KPI 有助于组织持续提升云性能和运营效率。
云基础设施未来将如何发展?
云基础设施的未来正朝着更加分布式、自动化和智能化的方向发展。以下几个关键趋势正在塑造下一代云环境:
- 无服务器计算。开发人员无需管理服务器即可运行应用,从而实现基础设施的自动扩展。
- 边缘计算。在更靠近用户和设备的位置处理数据可降低延迟并为实时应用提供支持。
- AI 驱动型运维 (AIOps)。人工智能正被广泛用于监控、优化和自动化基础设施管理。
- 可持续云基础设施。各提供商正致力于投资高能效的数据中心和绿色云技术,以减少对环境的影响。
这些趋势共同推动云平台朝着更具可扩展性、更智能和更高效的方向发展。