5个迹象表明,要修复高可用性,需要花费比博客文章更多的时间
标志在那里。 警告灯闪烁。在您的直觉中,您可以感觉到它。 也许你睡不着您的高可用性问题很深。 但是,也许您不太确定。
1.如果您认为云SLA是高可用性所需的全部
云解决方案在提高硬件可用性和弹性方面取得了巨大进步。 但是,应用程序高可用性不仅需要选择正确的管理程序或云提供商,还需要更多。 云或虚拟化提供商提供的SLA不能阻止您的高可用性策略。 正如Wired所引用的那样,“ 2011年4月近四天的Amazon中断并未违反Amazon的EC2 SLA,正如FAQ所解释的那样,“保证了在365年内某个区域内99.95%的服务可用性。”在这篇DZone文章中,我们自己的David Bermingham详细细分了云SLA和应用程序可用性之间的差异。 如果您想要一个高度可用的基础架构,则它还必须包括在数据和应用程序层的监视,恢复和弹性。
2.如果您仅使用开源操作系统随附的高可用性群集
如果是这样,那么您很可能没有根据与操作系统捆绑在一起的数据库来选择数据库,那么为什么仅根据该标准选择HA解决方案。 捆绑的工具在提供额外的保证,可能性和功能方面大有帮助。 但是,尽管易于访问,捆绑的工具和OS群集软件并不总是能够满足您的SLA,RPO,RTO和可用性要求。 如果您的企业具有操作系统的组合,则您的团队可能需要导航不同工具并了解它们如何集成在一起的帮助。 这有点像选择树篱修剪器,然后将路边的割草机推到路边,在13洞5杆洞(奥古斯塔)上塑造“杜鹃花”。 两台割草机都旨在割草,但是您有多少时间? 您将如何处理复杂性? 您会信任哪个? 您的高可用性策略所需要的不只是考虑与操作系统捆绑在一起的便利性,否则,您将运行MySQL而不是SAP HANA。
3.如果您认为企业应用程序许可(例如SQL Enterprise或Oracle Enterprise)与企业高可用性相同
除了增加成本外,许多企业应用程序许可证还提高了应用程序在某些高可用性方案中恢复的能力。 但是,整个企业极不可能基于单个应用程序。 您的高可用性不仅需要高可用性的数据库解决方案。 您将需要一个企业级应用程序监视和恢复解决方案,该解决方案需要对所有应用程序和数据库的广泛支持。 此外,您不仅需要管理和复制数据库数据的能力,还需要管理和复制关键应用程序和配置数据的能力。 单个数据库或简单应用程序的可用性是一回事,但是复杂,多部分应用程序和支持数据库的HA却大不相同。 在故障转移/切换之前,期间和之后,需要提供更多的服务,需要协调的更多部分,要协调的更复杂的体系结构,要遵循的更具体的最佳实践。 超出您企业许可证所支付的价格。
4.如果您的停机时间在增加,而停机时间在减少
在许多领域,生活的节奏都在不断增加。 您的团队最后一次从备份中恢复,手动重新启动被认为是关键的应用程序或重新启动一组故障的虚拟机或节点是什么时候? 中断事件的速度不能继续超过可持续性,或者您的团队有能力从消防转向防火和防火。 “你只能跑那么久这么久(Carey Nieuwhof)。”对于某些人来说,您交火已经太久了,而且停机时间比正常运行时间更为普遍。
5.如果您的第一个故障转移测试是在生产服务器上
最近的一位客户指出,不可能针对每种可能的灾难情况进行测试。 随着新软件的创建,部署,更新和修补,更高可用性方面的挑战越来越大。 但是,您的实时生产数据不是找出不能一起很好发挥作用的地方。 尽管Go-Live和Post-Go-Live总是会带来很多惊喜,但是无法真正进行故障转移和在备份节点上运行不应是其中之一。
精练博客可以为您提供有用的提示和见解,以定义,重新定义和提高您的更高可用性。 但是,如果警告信号消失了,您已经用某种“足够”来换取了真正的可用性,那么修复该问题所需要的不仅仅是博客文章,或者是在可用性世界中搜索每篇博客文章来解决的问题。您的医管局。
–客户体验副总裁Cassius Rhue
经SIOS许可转载