业务连续性规划 什么是业务连续性灾难恢复计划?
业务连续性灾难恢复 (BCDR) 计划是一个战略框架,使组织能够在发生中断后维持或快速恢复关键业务运营。它概述了关键业务流程、人员、IT 系统和供应链在面临预期和不可预见的事件时该如何运作,从而将应急响应和恢复有机结合在一起。
业务连续性规划的核心在于恢复能力 — 不仅仅是从灾难中恢复,而且要以最小的影响继续运营。强大的业务连续性计划 (BCP) 可以识别漏洞、确定基本功能的优先级,并围绕协调的响应分配人员、流程和技术。
阅读时长:7 分 53 秒 | 发布日期:2025 年 8 月 21 日
目录
从业务影响分析开始
制定业务连续性计划始于业务影响分析 (BIA) — 深入评估各种类型的中断如何影响您的运营。这包括评估基础设施、应用、供应链、数据和人员之间的依赖关系。
BIA 给出了关键恢复指标的定义:
- 恢复时间目标 (RTO):必须恢复系统和流程的指定时间
- 恢复点目标 (RPO):指可接受的最大数据丢失量,以时间为衡量单位
- 最大可容忍停机时间 (MTD):在不造成重大损害的情况下,进程不可用的最长可接受时间
- 最大可容忍数据丢失 (MTDL):在数据丢失导致不可接受的后果之前业务职能可以承受的最大数据丢失
这些指标推动了服务级别协议 (SLA) 的创建并指导了恢复策略的选择。
业务连续性规划还依赖于理解两个不太常讨论但至关重要的指标:事故响应时间 (IRT) 和运营恢复时间 (ORT)。
- 事故响应时间 (IRT) 是指从中断发生到业务连续性或灾难恢复计划启动之间的时间。快速识别和响应可以显著防止损害扩大。
- 运营恢复时间 (ORT) 表示系统重新上线后恢复全部功能所需的时间。这包括员工重新参与、重新同步应用和重新建立外部集成等流程。
应对意外情况的业务连续性计划
业务连续性计划可帮助组织应对意外中断(例如自然灾害、网络攻击或系统故障)以及计划中断(例如维护或升级)。计划通常包括:
- 冗余系统和故障转移基础设施
- 工作场所恢复和远程访问程序
- 数据保护与灾难恢复策略
- 网络安全和网络恢复策略
- 危机沟通计划和决策层级
这不仅事关恢复技术,而是确保在全面恢复工作进行的同时,关键服务能够继续运行。
IT 运维依赖于高可用性 (HA) 存储、服务器群集、负载平衡、安全信息和事件管理系统、网络库、不可变备份、持续数据保护和自动故障转移等技术。这些措施对于最大限度地减少停机时间和保持混合和多云环境中的数据完整性至关重要。
测试、维护、更新您的 BCP
业务连续性规划不是一次性事件。为了有效发挥作用,BCP 必须:
- 通过演习和模拟定期测试
- 持续更新以反映技术、人员或业务优先级的变化
- 由跨职能业务连续性管理团队 (BCMT) 共同拥有,该团队涵盖 IT、人力资源、运营、合规和执行管理层。
如果没有对测试和改进的持续投资,业务连续性计划在原本强大的风险管理策略中可能会沦为薄弱环节。
业务连续性计划如何演变?
从历史上看,BCP 专注于运营恢复。但勒索软件、流行病和气候变化等现代威胁促使人们转向更敏捷、更具恢复能力的战略。业务连续性规划现在要求:
- 支持远程访问和动态工作负载的可扩展基础设施
- 每个接入点都内置网络安全
- 跨物理、数字和云环境的协调
组织还必须为同时影响 IT 系统和业务职能的中断做好准备。因此,灾难恢复 (DR) 已演变成为更广泛的连续性规划的一个组成部分。
为什么业务连续性计划很重要?
为了保持成功,有韧性的公司准备好应对破坏性事件并通过业务连续性计划保持运营。通过正式的业务连续性计划,组织可以确保在任何情况下都能继续运转。提前做好准备决定着企业是能够重新开始运营,还是陷入停滞。
缺乏业务连续性计划可能会造成灾难性的后果。停机时间(无论是几分钟还是几天)可能导致收入损失、声誉受损,甚至企业倒闭。如果没有做好准备,公司可能会发现自己无法恢复。
全面的 BCP 可确保:
- 产品和服务交付持续进行
- 员工安全无忧且能高效工作
- 品牌声誉受到保护
- 组织满足监管和合同义务
业务持续性与灾难恢复与网络恢复
业务连续性、灾难恢复和网络恢复虽然密切相关,但它们涉及运营恢复能力的不同方面:
- 业务连续性涵盖了在中断期间保持运营运行的所有方面
- 灾难恢复的重点是在发生中断后还原 IT 系统和数据,无论导致中断的缘由是自然灾害还是系统故障
- 网络恢复与灾难恢复的目标相同,但专门针对勒索软件等网络攻击造成的故意破坏而量身打造。它包括安全、不可变的备份、隔离恢复库和自动还原功能。
全面的 BCDR 计划融合了所有三种方法,拓宽了恢复策略的广度和深度。
关键性评级作为分类业务职能的一种手段
业务影响分析 (BIA) 最具影响力的成果之一是对业务职能分配的关键性评级。该框架可帮助组织根据紧急程度和影响对恢复工作进行分类。
典型的 4 层级包括:
- 第 1 层:关键功能 — 必须在几分钟到几小时内恢复,以避免重大中断
- 第 2 级:基本功能 — 应在 24 至 72 小时内恢复
- 第 3 级:必要功能 — 最迟一周可恢复,且不会造成严重影响
- 第 4 层:理想功能 — 可以在较长时间内恢复,且不会造成重大后果
按功能举例:
- 处理金融交易的能力对于金融行业至关重要,即使是短暂的停机也会影响收入和信任。
- 在医疗保健领域,获取电子病历 (EHR) 至关重要,因为做出生死攸关的决定取决于实时数据。
- 在电子商务和零售业中,管理在线订单和客户服务单的能力至关重要,因为客户满意度和收入流取决于连续性。
网络安全是连续性的主动支柱
虽然恢复本质上被动执行,但网络安全却要主动出击 — 专注于威胁的预防、检测和响应。现代业务连续性规划必须整合各层的网络安全,包括:
- 网络与端点安全
- 多因素身份验证和访问控制
- 数据加密和安全备份
- 安全运维中心 (SOC) 集成。
网络安全是业务连续性的关键组成部分,可以防止中断发生。将网络安全与网络恢复相结合,可以提供主动和被动的连续性,以应对已知和未知的网络威胁。
业务连续性和业务恢复能力之间有什么区别
业务连续性侧重于在中断期间维持运营,而业务恢复能力则侧重于在面对长期挑战时不断适应和发展。成熟的连续性计划是构建跨 IT、运营、供应链和劳动力模型的组织恢复能力的基础。
技术如何帮助确保业务连续性?
技术是现代业务连续性的核心。从医疗保健到教育再到小型企业,各组织都在采用支持日常运营和应急准备的数字化战略。例如:
- 用于安全远程访问的云原生平台
- 分布式团队的虚拟桌面基础设施 (VDI)
- 高可用性存储和群集,实现零中断正常运行时间
- 持续数据保护 (CDP) 和备份自动化
- 触发即时恢复工作流程的监控和编排工具
业务连续性评估和跟进的最终结果是转向新常态,推动创新和突破,有时甚至会带来新的商业模式。
HPE 如何确保业务连续性?
HPE 帮助支持运营和业务生产力以及规划和执行服务,以加快取得业务成果。利用 HPE 数十年的基础设施经验并探索以下解决方案:
预配置的 HPE ProLiant ML 和 DL 服务器及软件极易部署。HPE Integrated Lights out (iLO) 服务器管理软件支持本地和远程监控与管理。
即服务模式可实现云一般的灵活性,又具备本地数据中心的控制力、安全性和可靠性。HPE 提供了一款市场领先的 ITaaS 产品,让您使用 HPE GreenLake 即可在本地基础设施上尽享云体验。
小型企业可以找到多种选项来部署虚拟化桌面界面并实现集中存储和安全、数据保护、全天候可用性以及可选的归档和灾难恢复存储。在 HPE,我们的服务器虚拟化解决方案建立在具有可扩展和优化处理器的 HPE ProLiant 服务器上。
利用 HPE Zerto Software 增强网络恢复能力、灾难恢复和持续数据保护功能,大幅减少数据丢失和停机现象。借助行业领先的 RPO 和 RTO 目标,为您的业务提供保护,最大限度减少因灾难、网络攻击及迁移导致的数据丢失与停机时间。
利用 HPE Cyber Resilience Vault 可保护您的数据和业务运营免受日益严重的网络攻击威胁。设计和定制坚固的恢复库,旨在减轻最具破坏性的勒索软件攻击带来的影响。
借助 AI 驱动型云管理、分散式扩展和针对所有工作负载的 100% 数据可用性,更新改造企业块和文件存储。HPE Alletra Storage MP B10000 提供阵列内智能勒索软件检测和恢复技术,帮助您确保数据抵御勒索软件攻击。
部署灵活的 HPE Alletra Storage MP X10000 解决方案,可实现多达 20 倍的数据缩减,同时确保数据受到保护、合规、安全且可用。
利用 HPE StoreOnce Systems 构筑坚实的网络恢复能力基础。以更高的简洁性、更强的性能以及内置的威胁与恶意软件防护转变您的混合云保护策略——且成本低于传统备份解决方案。
在防止勒索软件攻击方面,HPE Storage Tape 基于磁带的备份所具有的气隙安全性展现了安全、可扩展、低成本存储解决方案的巨大优势。
有了这样的解决方案,您就可以通过考虑到基础设施的复杂性和多样性以及需求的多变性基础设施和软件,安全可靠地访问数据,为停机威胁做好准备。HPE 解决方案可让您评估不断发展的进展并找到有助于提高运营流程充分性的技术。