Date: 11月 2, 2021
标签:SIOS
灾难恢复
如何使用单个集群软件解决方案实现灾难恢复
通过灾难恢复保护在物理、虚拟、云或混合云基础架构的任意组合中运行的 Windows 或 Linux 应用程序
什么是灾难恢复?
灾难恢复对持续业务运营至关重要
灾难恢复 (DR) 是一种策略和一组策略、程序和工具,可确保关键 IT 系统、数据库和应用程序在发生人为或自然灾害时继续运行并可供用户使用。 虽然 IT 团队拥有灾难恢复策略,但 DR 是每个组织业务连续性计划的重要组成部分,该计划是一种策略以及一组策略、程序和工具,可在灾难发生后使整个业务恢复正常运行。
但是,当我们谈到灾难时,它不一定是影响您业务的全面飓风、龙卷风、洪水或地震。 灾难有多种形式,包括网络攻击、用户错误、火灾、盗窃、故意破坏,甚至恐怖袭击。 简而言之,灾难是任何导致系统长期停机和/或大规模数据丢失并影响您的 IT 基础设施、数据中心和业务的危机。
在最近的 Spiceworks民意调查,59% 的组织表示他们在一年内经历了 1 到 3 次中断(即 IT 相关服务正常水平的任何中断),11% 的组织经历了 4 到 6 次,7% 的组织经历了 7 次或更多的。 此外,调查还表明,依赖更多服务的大型公司比小型组织更有可能遇到中断。 例如,71% 的小型企业在过去 12 个月内经历了一次或多次中断,而中型企业和大型企业的这一比例分别为 79% 和 87%。 当您查看这些统计数据时,您就会知道如果您没有适当的灾难恢复计划,您将生活在借来的时间里。
但有好消息。 与前几年的统计数据相比,在制定灾难恢复计划方面,各种规模和各行各业的组织似乎都做得更好。 根据 Spiceworks 的同一项调查, 95%的组织制定了 DR 计划,但不幸的是,23% 的组织从未测试或执行他们的计划。 执行您的 DR 计划与学生消防演习或集合演习一样重要。 制定计划只是第一步。 如果参与执行计划的人不知道该怎么做,您将无法从灾难中恢复。
高可用性对比灾难恢复
但在我们进一步讨论之前,让我们明确处理系统故障与灾难的最佳实践之间的区别。 要从系统故障中恢复,冗余系统、软件和数据应位于局域网 (LAN) 上。 对于关键数据库应用程序,您可以跨 LAN 同步复制数据。 这使您的备用实例“热”并与您的活动实例同步,因此它可以在发生故障时立即接管。 这被称为高可用性 (HA) .
但是,要在发生灾难时恢复系统、软件和数据,意味着冗余组件必须位于广域网 (WAN) 上。 对于 WAN,数据复制是异步的,以避免对吞吐量性能产生负面影响。 这意味着对备用实例的更新将滞后于对活动实例的更新,从而导致恢复过程的延迟。 由于灾难很少发生,一些延迟可能是可以容忍的,并且取决于 (a) 实现尽可能低的恢复时间目标 (RTO) 和恢复点目标 (RPO) 对您的业务有多重要,以及 (b) 您有多少预算可以分配以达到最佳的 RTO 和 RPO。
RTO 是任何中断的最大可容忍持续时间,RPO 是灾难发生时可容忍的最大数据丢失量。 对于灾难恢复,一些解决方案通常需要几分钟甚至几小时的 RTO,因为在短短几分钟内尝试通过 WAN 进行恢复成本太高。 对于任务关键型应用程序,您的组织希望实现较低的 RPO,但 RPO 越低,您就越需要适当的流程来确保所有数据在故障转移之前都已复制到备用服务器上。 这种努力往往会增加恢复时间。
但是使用 SIOS 灾难恢复解决方案,您可以实现最小到无数据丢失的 RPO 和一到两分钟的 RTO。
SIOS 提供一种解决方案来满足您的 HA 和 DR 需求
无论您需要单个站点内的本地 HA 还是跨多个站点的快速、高效的灾难恢复,SIOS 解决方案都能满足您的所有业务连续性需求。 |
这SIOS容灾解决方案是一个多站点、地理上分散的集群,可提供数秒的 RPO 和数分钟的 RTO。 SIOS 与许多其他灾难恢复提供商的不同之处在于,它提供了一种解决方案,可同时满足高可用性和灾难恢复需求。
为了支持 DR,您可以按照与实现高可用性相同的方式配置集群,但有两个之前讨论过的明显区别:
- DR 群集节点位于离 HA 实例更远的地理位置(本地、虚拟或云中)中。
- DR 站点位于广域网 (WAN) 上,这意味着数据复制将是异步的,以避免对吞吐量性能产生负面影响。
请记住,异步数据复制意味着对 DR 实例的更新将滞后对活动实例的更新,但通常最多只有几秒钟。 但是,借助 SIOS 跨 WAN 的令人难以置信的快速数据复制,您可以在多个服务器和数据中心之间保持数据的实时副本同步,以实现 HA 和 DR。
除了用于 HA/DR 和实时数据复制的单一解决方案外,SIOS HA/DR 解决方案还提供:
- 块级数据压缩以最小化网络负载
- 带宽限制以调节和最小化网络拥塞
- 广域网优化以提高网络性能
- 与一键式故障转移集成以支持 DR 和自动故障转移以支持 HA
- 一种不可知的平台方法,允许您选择本地、虚拟、云或混合 DR 解决方案
以下案例研究展示了使用 SIOS DataKeeper 在单个解决方案中提供 HA 和 DR。
——————————————————————————————————————————————————
在高级医疗中心启用 HA 和 DR 保护
位于以色列的 ALYN 医院是首屈一指的儿科康复健康中心,专门诊断和康复患有身体残疾的婴儿、儿童和青少年。 父母带着他们的孩子从以色列和国外接受广泛的医疗服务、辅助医疗和额外的最先进的康复服务。
寻找正确的解决方案
ALYN 医院运营着各种应用程序——包括电子病历 (EMR)、客户关系管理 (CRM)、SQL Server 数据库、Microsoft Exchange 和 Microsoft Office,以支持其临床和行政运营。 作为医疗保健提供者,医院受到严格的政府法规的约束,需要实施强有力的 DR 规定,以确保其关键任务应用程序的保护和可用性。 医院选择 Hyper-V Replica 来支持其灾难恢复策略,在本地运行两个物理上分离的服务器机房,使运行在任何 Hyper-V 主机服务器上的所有关键虚拟机 (VN) 都可以复制到另一个房间的另一个机房。 不幸的是,这种配置不能满足 RPO 和 RTO 要求,因此 IT 团队开始研究其他选项。
在寻找合适的 DR 解决方案时,IT 团队考虑了使用共享存储的 Windows Server 故障转移群集 (WSFC)。 不幸的是,ALYN 没有适当的 SAN,而且由于预算限制,在两个服务器机房中实施相同的 SAN 成本过高。 为此,ALYN 调查了第三方解决方案。
寻找第三方故障转移聚类软件, ALYN 建立了三个标准:
- 该解决方案必须与现有硬件配合使用。
- 该解决方案必须为所有医院关键应用程序提供高可用性 (HA) 和灾难恢复 (DR) 保护。
- 总拥有成本 (TCO) 必须符合部门有限的预算。
SIOS DataKeeper – 显而易见的选择
在评估了几种不同的解决方案后,IT 人员选择了 SIOS DataKeeper,该团队将其描述为“以极低的总拥有成本提供运营商级功能”的解决方案,并在单个经济高效的解决方案中提供 HA 和 DR。
SIOS DataKeeper 将实时、块级数据复制与连续应用级监控和灵活的故障转移/故障恢复策略结合在一个易于实施和管理的整体解决方案中。 DataKeeper 利用 WSFC 并保持与运行环境的兼容性,使 IT 团队可以轻松快速了解如何使用该解决方案并快速完成所有应用程序的 HA 配置。
使用 DataKeeper,IT 团队可以创建三节点 SANless故障转移集群具有一个活动实例和两个备用实例。 通过这种配置,ALYN 可以在不中断操作的情况下持续更新系统和软件,因为活动实例可以移动到三节点集群中的任何服务器,并在计划的硬件和软件维护期间保持完全保护。
此外,SIOS 可以与任何类型的存储和广域网优化的数据复制一起使用,从而简化了 ALYN 远程 DR 站点的实施。 为了保持高事务吞吐量性能,WAN 上的数据复制异步发生,但 SIOS DataKeeper 使用特殊技术来优化数据传输,允许 ALYN 实现苛刻的 RPO 和 RTO。
底线
如今,SIOS DataKeeper 为 ALYN Hospital 的所有关键任务应用程序提供高可用性保护。 ALYN 医院 IT 总监 Uri Inbar 评论道:“通过 SIOS,我们找到了一种解决方案,能够以非常低的总拥有成本提供运营商级的功能。 对我们来说,这是一个显而易见的选择。
ALYN 医院定期测试配置,定期更改活动和备用名称,同时在计划的软件更新期间根据需要重定向数据复制。 应用程序继续不间断地运行。
——————————————————————————————————————————————————
关于 SIOS 灾难恢复的最终想法
在 Windows 环境中,SIOS DataKeeper for Windows Server 提供标准版和更强大的集群版。SIOS DataKeeper 标准版为 Windows Server 环境中的灾难恢复保护提供实时数据复制。SIOS DataKeeper 集群版与 Windows Server 故障转移群集 (WSFC) 无缝集成,支持高可用性和灾难恢复配置。
SIOS LifeKeeper 和 DataKeeper 支持所有主要的 Linux 发行版,包括 Red Hat Enterprise Linux、SUSE Linux Enterprise Server、CentOS 和 Oracle Linux,并适用于各种存储架构。
有关 SIOS DataKeeper 或 SIOS LifeKeeper 的更多信息,请访问以下参考资料:参考
- https://betanews.com/2019/05/28/disaster-recovery-sql-server/
- https://community.spiceworks.com/blog/3138-data-snapshot-how-well-equipped-are-businesses-to-bounce-back-from-disaster
- https://www.spiceworks.com/press/releases/spiceworks-study-reveals-one-in-four-companies-never-test-their-disaster-recovery-plan/
请参阅我们的白皮书:了解 SQL Server 选项的灾难恢复