动态利用率将使高可用性更加经济实惠,进一步推动向云迁移
云中的按需配置并不是什么新鲜事。对于混合和纯公共云配置中的高可用性和灾难恢复,新功能将是更具成本效益的选择。这种按需HA和DR将利用在多个数据中心和地理区域之间传播的资源的动态利用,并使更多应用程序实现更高的服务水平。
HA和DR都需要冗余以确保从故障中可靠,快速地恢复。
HA故障转移群集复制主VM的完整操作环境,包括辅助VM中的CPU,内存和存储资源。然后,所有数据也会实时复制到辅助服务器,辅助服务器将保持空闲状态,除非并且直到主服务器发生故障。拥有一个或多个完全冗余的辅助虚拟机会创建一个有效处于持续自检状态的集群,从而确保它为自动和快速故障转移做好准备。
相比之下,基本DR配置缺乏快速故障转移所需的功能
例如,考虑Azure Site Recovery。微软将ASR定位为DR-as-a-service。不断增长的DRaaS市场现在包括来自近十几家提供商的产品。使用ASR,主VM将复制到其他Azure区域中的辅助节点,或从本地实例复制到Azure云。但数据并未实时复制。 该服务无法从应用程序级别停机的多种原因中自动检测和故障转移。
基础问题
DRaaS和其他云可用性服务根本没有涵盖许多潜在的故障点。通常,检测到完全丢失服务。但是,未检测到应用程序或OS软件导致的故障,以及网络或存储等离散资源的故障。因此,应用程序服务可能会中断 – 可能会延长一段时间 – 而不会被云自己的恢复设施检测到。
SIOS技术的SIOS DataKeeper和SIOS Protection Suite
当高可用性至关重要时,全面的故障检测对于避免应用程序级别的停机时间至关重要。使用专门构建的故障转移群集技术可轻松实现此目标,例如SIOS Data的SIOS DataKeeper和SIOS Protection Suite,它能够自动检测软件和底层物理和虚拟资源中的各种停机原因。这些仅限软件的群集分布在云端,以提供完整的HA / DR解决方案,包括数据复制,持续的应用程序级监控和可配置的故障转移/故障恢复恢复策略。
DRaaS产品
故障转移群集软件可以单独配置为HA或DR,也可以配置为HA和DR的组合。DR通常在称为GeoCluster的配置中的另一个区域中具有备用VM。与DRaaS产品一样,WAN带宽限制会导致数据出现“复制滞后”,并可能在某些故障情况下导致某些数据丢失。但与DRaaS不同,云平台和应用程序级别会自动检测到大类故障,并可立即纠正以确保服务连续性。虽然故障转移群集具有最小化恢复点和恢复时间目标(RPO / RTO)的能力,与DRaaS相比提供全面的服务保护,但仍需要完全配置昂贵的冗余和空闲资源。幸运的是,新兴的集群管理技术正在解决这个问题,这些技术可以通过在发生故障时动态分配资源来协调完全恢复。
一种新方法
备用VM在待机模式下运行时,仅配置了处理主VM数据复制目标的极简主义角色所需的资源。发生故障时,群集会立即动态地重新配置备用VM,并提供完整的资源补充,以提供其主VM全面运行角色所需的性能级别。这种动态利用使HA和DR保护能够从显着的成本节约中受益,而不会牺牲群集的可用性和可靠性优势。
结论
无论是单独运行还是协同运行,HA故障转移群集和DRaaS都可以发挥作用,使HA和DR保护的连续性对于全系列企业应用程序来说更加经济实惠 – 从那些可以容忍一些数据丢失和延长在所有可能的故障情况下,需要RPO为零(无数据丢失)且RTO小于5分钟的停机时间。
关于作者
Jerry Melnick是SIOS Technology的总裁兼首席执行官,负责指导整体公司战略并领导公司的持续增长和扩张。他在企业和高可用性软件市场拥有超过25年的经验。在加入SIOS之前,他是Marathon Technologies的首席技术官,负责公司的容错解决方案的业务和产品战略。他的经验还包括PPGx,Inc。和Belmont Research的管理职位,负责建立一个专注于提供数据仓库和分析工具的尖端软件产品和咨询业务。Jerry的职业生涯始于Digital Equipment Corporation,他领导的是一个创业型业务部门,提供高度可扩展的关键任务数据库平台,以支持医疗,金融和电信市场中的企业计算环境。他拥有伯洛伊特学院理学学士学位,毕业于波士顿大学计算机工程和计算机科学专业。