构建高可用性群集配置
构建高可用性群集配置时,您的应用程序可用性仅与其最薄弱的链接一样好。这意味着,如果您购买了具有冗余一切(CPU,风扇,电源,RAID,RAM等)和具有多路径连接的超豪华SAN的优质服务器。与多个SAN交换机配合使用,并将您的应用程序与您喜欢的群集软件集中在一起。 你可能有一个非常可靠的应用程序 – 对吧?嗯,不一定。服务器是否插入同一台UPS?它们是否在同一个网络交换机上?它们是否由同一个交流单元冷却?他们在同一栋楼里吗?您的SAN真的可靠吗?其中任何一个问题都是高可用性群集配置中的单点故障。
寻找和删除群集配置中最薄弱的环节
当然,你必须知道什么时候“足够好”是“足够好”的。你的预算和你的SLA将有助于决定什么是好的。然而,我担心人们可能正在掠过的一个领域是存储领域。随着廉价或免费的iSCSI目标软件解决方案的出现,我看到一些人建议你只是将一些iSCSI目标软件放在备用服务器上,并且即时共享存储。
请注意,我不是在谈论内置故障转移技术和/或其他可用性功能的OEM iSCSI解决方案;甚至是FalconStor等存储虚拟化解决方案。我正在谈论那些运行Windows Server 2008的服务器,他装载了存储并希望将其转换为iSCSI目标。这在实验室很棒。但如果你认真对待医管局,你应该再考虑一下。即使是微软也只提供他们的iSCSI目标软件给合格的OEM制造商,他们在提供企业级存储阵列上经验丰富。
你实际上得到了什么?
首先,这是Windows。 没有一些经过强化的操作系统只能用于存储。这将需要维护,安全更新,硬件修复等。它基本上与您要保护的应用程序服务器具有相同的可靠性。集群应用程序服务器是否有意义。然而,使用相同类别的服务器和操作系统来托管您的存储?您基本上已将单点故障从应用程序服务器移开并将其移至存储服务器。就我而言,这不是一个聪明的举动。
某些企业级iSCSI目标软件包括同步和/或异步复制软件和快照功能。此功能肯定有助于恢复点目标(RPO)。虽然它不会帮助您恢复时间目标(RTO),除非故障转移是自动且无缝到您的群集软件。假设主iSCSI存储阵列在半夜失败。谁将在那里激活复制副本?在您意识到存在问题之前,您可能已经停机了很长时间。再次,这可能是“足够好”;你只需要知道你正在注册的东西。这是您正在寻找的高可用性群集配置吗?
SIOS DataKeeper
为提高iSCSI目标服务器的可靠性,您可以做的一件事是使用SteelEye DataKeeper Cluster Edition等复制产品来消除单点故障。让我来说明一下。
如果我们采用上面显示的相同配置并使用SteelEye DataKeeper Cluster Edition添加热备用iSCSI目标来执行复制和自动故障转移,那么您刚刚为iSCSI目标解决方案提供了全新的可用性级别。这个解决方案看起来非常像这样。
使用SteelEye DataKeeper Cluster Edition的解决方案与某些iSCSI目标供应商提供的复制解决方案的主要区别在于与WSFC的集成。要问你的iSCSI解决方案供应商的问题是这样的…
如果我拔下活动的iSCSI目标服务器上的电源线,会发生什么情况?
如果恢复过程是手动过程,则不是真正的HA解决方案。但是如果它是自动的并且与WSFC完全集成呢?然后,您可以获得更高级别的可用性,并将iSCSI阵列作为单点故障排除在外。
与我们聊天也可以实现高可用性群集配置
经Clusteringformortals许可转载。