Date: 1月 18, 2018
如何在多站点群集中使用异步复制?数据不同步?
我被问过这个问题不止几次了,所以我想我会在我的第一篇博文中回答这个问题。 基本答案是肯定的,在多站点集群中使用异步复制时,可能会导致意外失败的数据丢失。 在一个理想的世界里,每个公司都会有一个到他们灾难恢复站点的暗光纤连接,并使用与他们的多站点集群同步复制,消除数据丢失的可能性。 但是,现实情况是,在许多情况下,到灾难恢复站点的广域网连接有太多的延迟来支持同步复制。 在这种情况下,异步复制是一个很好的选择。
我的选择是什么?
选择与WSFC多站点群集一起使用的异步复制解决方案时,有多个选项。这包括来自EMC,IBM,HP等公司的基于阵列的解决方案。和基于主机的解决方案,比如我亲近的解决方案,“SteelEye DataKeeper Cluster Edition”。 由于我最了解DataKeeper,所以我将解释DataKeeper的这一切是如何工作的。
SteelEye DataKeeper怎么样?
当使用SteelEye DataKeeper和异步复制时,我们允许将一定数量的写入存储在异步队列中。 可以排队的写入次数由“高水位线”确定。这是DataKeeper使用的可调整值,用于确定在镜像状态从“镜像”更改为“暂停”之前队列中可以有多少数据。 当辅助服务器和主服务器之间发生通信故障时,也会进入“暂停”状态。处于暂停状态时,多站点群集中的自动故障转移将被禁用,从而限制意外故障中可能丢失的数据量。 如果原始数据集被认为是“永久丢失”,则可以手动解锁目标服务器上的剩余数据,然后可以使集群节点投入使用。
在“暂停”状态下,DataKeeper允许异步队列耗尽,直到达到“低水位”,此时镜像将进入“重新同步”状态,直到所有数据再次同步。 此时,镜像再次处于“镜像”状态,自动故障转移再次启用。
只要你的广域网链路没有饱和或破坏,在这个异步队列中的任何时候,你永远不应该看到更多的写入。 如果出现意外的故障(请拔掉电源线),您将失去异步队列中的任何写入。 当您需要使用多站点群集实现的卓越恢复点目标(RPO)和恢复时间目标(RTO)时,这是您所做的权衡,但您的WAN链路有太多的延迟来有效支持同步复制。
试试SteelEye DataKeeper
花时间通过Windows性能日志和警报监控DataKeeper异步队列。我想您会惊喜地发现,由于DataKeeper复制引擎的效率,异步队列大部分都是空的。 即使在写入繁重的时候,异步队列也很少增长,并且几乎立即耗尽。因此,在任何给定时间处于风险中的数据量是最小的。 与从昨晚的备份恢复的灾难中的备选方案相比,使用异步复制在意外故障中丢失的写入次数最少!
当然,也有一些情况下,即使丢失一个单一的写是不可容忍的。 在这种情况下,建议在高速,低延迟的LAN或WAN连接上使用SteelEye DataKeeper的同步复制选项。
经Clusteringformeremortals.com许可转载