什么是云灾难恢复?

2025年3月17日 | 阅读11分钟

基于云的备份和检索功能可帮助您在业务关键目录遭到破坏时进行备份和重建。由于其高度适应性,云技术可实现高效的灾难恢复,无论任务的性质或严峻程度如何。数据保存在旨在提高可访问性的虚拟存储环境中。该程序可随时使用,使不同规模的公司能够根据其现有需求定制灾难恢复 (DR) 解决方案。

与传统替代方案相比,云灾难恢复 (CDR) 配置和维护简单。公司不再需要花费大量时间从内部数据库或硬盘传输数据备份,以便在发生灾难后进行恢复。云优化了这些程序、决策制定和信息检索。

云灾难恢复 (CDR) 基于一个可持续的程序,可让您在灾难中完全恢复安全功能,并提供对受保护虚拟世界中计算机设备的远程访问。

在内容灾难恢复方面,维护一个辅助数据中心可能成本高昂且耗时。CDR(云灾难恢复)通过消除对集中式系统的需求并大幅减少停机时间,改变了传统 DR(灾难恢复)的一切。信息技术 (IT) 部门现在可以利用云的优势,快速扭转局面并拒绝。这导致以更低的成本实现更快的恢复时间。

始终为适当的信息安全做好准备

Cloud disaster recovery

随着企业不断将系统、软件应用程序和服务添加到其日常流程中,相关的隐私问题显著增加。危机随时可能发生,并可能导致公司因大量信息丢失而遭受重创。当您意识到其成本时,很明显为什么建立信息恢复和检索计划是明智之举。

灾难恢复数据显示,98% 的受访公司表示,几个小时的停机时间可能给其公司造成超过10万美元的损失。任何数量的停机时间都可能给组织造成数万到数十万美元的人工损失,这些损失用于恢复或重新部署丢失的生产力。

在某些情况下,8小时的停机时间可能使小型企业损失高达2万美元,大型企业损失数千万。

鉴于这些估算,很明显为什么每一次协助或结构中断都对数据和包含危机管理计划的真正好处至关重要。

云灾难管理是如何运作的?

云灾难恢复采取了与传统 DR(灾难恢复)截然不同的视角。云灾难恢复不是将数据中心与操作系统技术堆叠并修复生产中使用的最终配置,而是将整个服务器,包括操作系统、应用程序、补丁和信息,捕获到一个单独的软件包或虚拟环境中。

然后,虚拟服务器被复制或支持到异地服务器场,或在几分钟内滚动到远程服务器。虽然虚拟服务器不依赖于硬件,但操作系统、应用程序、缺陷和信息可以比传统 DR 方法更快地从一个数据中心移动到另一个数据中心。

Rackware 如何为您提供帮助?

Rackware 发展了云管理技术,可帮助企业重新部署实施,提供额外的灾难恢复和回退,以及云存储管理。

RackWare 管理模块 (RMM) 通过简化灾难恢复和回退到任何服务器,为公司提供信息系统适应性。其部分功能如下所述:

Cloud disaster recovery
  • 单一框架

它是一个单一的集中式解决方案,支持复制、同步、集成和基于云的灾难恢复。

  • 广泛兼容

它支持所有物理、数字和网络环境、Hyper-v 和云无关负载。

  • 支持所有应用程序

它支持所有应用程序、其信息和设置,无需重写任何实现。

  • 防止锁定

Rackware 降低了物理到云、数据中心甚至云到物理恢复和灾难检索的风险和供应商绑定支持,无论供应商是谁。

  • 自动灾难恢复测试

尝试灾难恢复测试通过自动灾难恢复统计技术,帮助公司将时间成本和人工成本降低多达80%。

  • 个性化RTO/RPO

通过各种预配置或自适应方法,根据业务需求灵活地个性化RPO、RTO和成本优先级。

  • 动态资源调配

动态采购显著降低了提供灾难恢复事件服务器的成本,而不是预配置:这在发生故障之前不会使用计算资产。

  • 选择性同步

选择性同步支持一组任务关键型应用程序和文件系统的策略、安全性和优先级。

选择云灾难恢复提供商

选择云灾难恢复提供商时,必须考虑六个因素:可靠性、位置、安全性、合规性和可扩展性。

首先,公司必须了解CDR供应商的物理距离和吞吐量;将灾难恢复放置得太近会增加给定虚拟灾难的风险,但将DR放置得太远会增加频率和网络流量,使其更难获取DR资料。当DR信息可从多个国际业务地点获取时,该区域可能很崎岖。之后,识别云DR提供商的可靠性。只有云有停机时间,康复期间的系统故障对行业而言可能同样具有破坏性。

云灾难恢复方法论

识别云灾难恢复提供的可扩展性。它必须保护特定信息、应用程序和其他资产,同时在需要时容纳额外资源,并提供足够的效率,因为其他国际客户使用这些设施。识别灾难恢复内容的安全性需求,并确保供应商可以提供身份验证、VPN(虚拟专用网络)、加密和其他工具包,这些工具包是保护其重要资源所必需的。

最后,建议如何设计DR系统。有三种基本的DR策略:热、冷和温。这些概念与结构恢复的难易程度有着模糊的联系。

Cloud disaster recovery
  • 温灾难恢复

温灾难恢复是一种备用策略,其中副本数据和系统存储在云DR供应商处,并定期更新到先前数据中心的服务和信息。然而,冗余资产并没有做任何事情。当灾难发生时,温DR可以从DR供应商处实施能力方法,这通常就像启动虚拟机并重新路由域名和流量到DR资产一样简单。虽然恢复时间可能非常有限,但受保护的任务仍然必须经历一些停机时间。

  • 冷灾难恢复

冷灾难恢复通常涉及存储信息或VMware虚拟 (VM) 图像。这些资源通常无法访问,除非执行额外的工作,例如检索存储的数据或将图像填充到虚拟机中。冷DR通常是最简单(通常只是内存)和最便宜的方法。但是,它需要很长时间才能恢复,在发生灾难时会给组织留下最长的停机时间。

  • 热灾难恢复

热灾难恢复传统上被描述为信息和任务的实时同步实施,它们并发运行。主数据中心和备份数据中心都同步执行特定任务和信息,两个站点共享总数据包的一小部分。当灾难发生时,剩余页面会继续处理事务而不会中断。消费者应该不会意识到这种中断。虽然热DR没有停机时间,但它是最复杂和最昂贵的方法。

云灾难恢复的优势

与更传统的灾难恢复策略相比,云DR具有许多显著优势。它们定义如下。

  • 按需付费选项

实施DIY(Do-It-Yourself)灾难恢复设施的公司会产生大量现金费用,而参与维护的托管供应商进行异地DR系统管理则需要冗长的许可协议。云提供商的按需付费框架允许公司仅对使用的程序和基础设施收取重复订阅费。交易会随着资产的添加或删除而修改。

  • 可扩展性和适应性

传统的灾难恢复方法通常在本地或远程云服务中实施,经常强制执行容量和可用性限制。公司必须购买灾难恢复所需的服务器、存储、网络设备和生产力工具,并设计、测量和构建管理灾难恢复活动所需的系统——如果灾难恢复导向辅助服务器场,则需要更多。这传统上是公司的一项重大资本和重复性支出。

  • 高可靠性和地理冗余

全球覆盖是云服务的必要条件,可确保多个系统支持全球重要地缘战略区域的客户。云提供商利用这一点来实现更高的持久性并保证重复。公司可以轻松使用地理重复来将灾难恢复资产放置在其他地方——甚至多个区域——以提高可访问性。经典的异地灾难恢复情况是云的自然形成。

  • 测试简单,恢复快速

云工作负载通常作为虚拟机 (VM) 运行,这使得将虚拟机映像文件复制到内部样本数据中心以验证工作负载可用性变得简单,而不会中断生产工作负载。此外,公司可以选择高带宽和快速磁盘 I/O(输入/输出)替代方案,以最大限度地提高传输速度,以满足恢复时间目标要求 (RTO)。然而,从云服务传输数据会产生费用,因此测试应考虑到这些数据传输——云数据出入——成本。

传统灾难恢复与云灾难恢复

基于云的灾难恢复系统和 DRaaS 推广可以带来成本节约、灵活性和可扩展性、地理重复和快速响应。然而,云灾难恢复可能不适用于所有公司或情况。请识别一些更传统的 DR 方法可能对公司有利,甚至至关重要的情况。

  • 合规性先决条件

云提供商在需要良好监管监督的领域(例如健康保险流通与责任法案 (HIPAA) 和支付卡行业数据安全标准 (PCI DSS))中,越来越允许创新使用。毕竟,一些公司在处理即时服务器场之外或不受公司直接控制的任何资产或设施(例如公共云平台等第三方设施)中的机密材料时,可能仍然面临限制。

  • 缺乏连接

云资源和服务依赖于全球范围内的广域网 (WAN) 通信。尽管快速更新/同步和快速恢复需要可靠、高带宽的连接,但灾难恢复使用的事件强调互连。尽管可靠、高带宽的实现闻名于世,在大多数城市和郊区,但远非全球普遍。

  • 优化恢复

云提供了强大的优势,但客户受限于云服务提供商提供的设备、架构设计和工具包。云灾难恢复受到供应商和服务级别协议 (SLA) 的限制。在许多情况下,云 DR 供应商的恢复点目标 (RPO) 和恢复时间目标 (RTO) 可能不适用于基础架构的灾难恢复要求,或者可能无法保证服务级别。通过采购 DR 框架,公司可以设计和实施定制的 DR 架构,以最好地满足 DR 性能标准。

  • 利用现有投资

DR需求的存在时间比云计算长得多,信誉良好的DR实施,尤其是在大型企业或费用仍在支出中的企业中,可能更难被现代云灾难恢复产品取代。一家已经拥有公司、数据中心、存储和其他资产的公司可能不愿放弃它们。在这种情况下,公司可以更缓慢、更谨慎地转向云灾难恢复,系统地将工作负载连接到云DR供应商,作为常规创新刷新的手段,而不是花费下一轮资金。

制定基于云的灾难恢复策略

制定云 DR 计划与制定更典型的文化或异地应急计划非常相似。云 DR 与更传统的 DR 方法的区别在于利用云服务和 DRaaS 来维持实际评估。例如,云灾难恢复不会将主要信息源备份到衡量另一个本地计算机中的差异,而是会将此信息集存储到云网络,包括 Amazon S3(简单存储服务)容器。因此,云灾难恢复不会改变执行 DR 阶段的基本要求,而是提供一系列新的高效工具和技术以实现 DR 目标。

主要有三个部分:实施、分析和测试。

Cloud disaster recovery
  • 分析

任何灾难恢复计划都必须从全面的风险评估和绩效衡量开始,该评估分析现有 IT 设施和业务流程,并识别组织面临的潜在灾难。目的是识别可能的安全漏洞和灾难,例如入侵安全漏洞和欺诈,以及自然灾害和风暴,然后评估另一个 IT 技术是否已准备好应对这些挑战。

分析可以帮助管理层实现最复杂的行业功能和IT方面,并预测灾难事件可能造成的经济影响。RPO和RTO也可以通过分析来确定设施和任务。

  • 实施

传统上,分析以结构性要求为特征,该要求详细说明了准备、预防、恢复和响应。旨在减少潜在威胁和消除弱点的举措被称为预防措施。这可能包括针对员工的社交操纵培训,以及为保持稳定性和安全性而进行的常用操作系统 (OS) 更新。准备工作包括强调适当的响应——在发生灾难时谁能做什么。这主要是文书工作问题。响应描述了在发生灾难时要使用的技术和产品。这与相关创新的实施(例如恢复备份到云的数据集或虚拟服务器)相结合,是弹性的体现。恢复描述了响应的成果情况,并采取措施帮助抵消任何潜在的投资损失。

  • 测试

最后,任何灾难恢复计划都必须定期筛选和审查,以确保IT员工能够准确实施适当的恢复工作,并且恢复在适当的格式下进行,以满足企业的需求。测试可以发现执行中的差异或不准确之处,帮助组织在实际灾难发生之前纠正和通知其灾难恢复计划。

云灾难恢复服务和供应商

云 DR 本质上是一种异地灾难恢复。异地模型使公司能够防范其本地基础设施(火灾、盗窃、洪水等)内的事件,并可以将资产恢复到本地基础设施或继续从 DR 供应商处运行大规模部署。因此,大量供应商涌现,以提供异地 DR 能力。

云灾难恢复最明显的途径是通过主要的公共云提供商。亚马逊网络服务 (AWS) 提供 CloudEndure 灾难恢复设施,Azure 提供 Azure Site Healing,GCP (Google Cloud Platform) 提供 Cloud Storage 和 Continuous Disk 替代方案,用于保护宝贵数据。

所有三个主要的云提供商都可以设计企业灾难恢复设施。

除了公共云之外,大量专门的灾难恢复供应商现在提供 DRaaS 产品,有效地获取了用于 DR 任务的专用云。

顶级 DRaaS 供应商包括

  • Iland
  • Expedient
  • IBM DRaaS
  • Sungard AS
  • TierPoint
  • Bluelock
  • Recovery Point Systems

此外,更通用的备份供应商现在也提供 DRaaS,例如

  • Acronis
  • Carbonite
  • Zerto
  • Databarracks
  • Arcserve UDP
  • Unitrends
  • Datto