如何购买最佳的高可用性解决方案
高可用性对于保护 IT 基础设施免遭停机至关重要,但如何找到最佳的 HA 解决方案来购买?我们概述了为什么很难弄清楚要购买什么,以及让管理层参与投资高可用性所需采取的步骤。
为什么购买优质的 HA 解决方案如此困难?
Barbara Joan(化名)领导的团队负责公司大部分 IT 基础设施,并不断努力说服管理层投资高可用性。每当她建议实施高可用性 (HA) 保护时,不同的同事都会表达他们的保留意见、反对意见、替代方案建议,甚至淡化自己企业应用程序过去几次中断的严重性。
她总是问自己同样的问题:如果根据组织、行业和受影响的应用程序,停机成本估计在 45,000 美元到 500,000 美元之间,那么为什么协调购买优质的产品如此困难? (成本有效)HA 解决方案?
让您的管理层相信 HA 是一项伟大投资的七种方法
1.考虑避免成本的投资回报率
HA 的投资回报率更准确地计算为成本避免。也就是说,将采取行动保持当前预期成本(增加高可用性)的成本与不采取行动(停机时间)的成本进行比较。
如果没有 HA 保护,停机是不可避免的,因为 IT 系统会受到多种停机因素的影响,从机械服务器故障到人为错误,再到软件不兼容等等。成本也根据不同的情况而有所不同。行业以及公司的规模。与具有本地或区域业务的小型公司相比,具有严格 SLA 和每天数百万笔交易的大型制造商将因计划外停机而遭受更大的损失。此外,如果您的企业受到严格监管或者是重要的服务提供商,则可能会因停机而产生额外的处罚成本,而不仅仅是所售产品和货物的损失。当 IT 评估人员错误地计算停机成本时,购买强大的商业解决方案就会变得更加困难。
-
考虑整体解决方案的成本
停机本身给公司造成的损失几乎是无法估量的——声誉受损、客户不满以及 IT 员工沮丧等等。芭芭拉·琼 (Barbara Joan) 厌倦了为了应对压力大、有时甚至是混乱的停机事件而中断她的富有成效的工作。您如何计算停机时间对昂贵的员工流动率造成的影响?
-
合适的医管局能够收回成本
一些公司认为,HA 解决方案的成本只是所需软件和服务器的成本。他们认为他们可以使用内部资源或云来创建自己的。然而,这些公司忘记考虑解决方案的许多不同方面及其各自的隐性成本。例如,本土解决方案在短期内实施起来可能更便宜,但它们通常包含隐性成本,例如维护、持续支持、团队培训、文档、技术债务和故障修复开发。此外,许多本土解决方案在证明“我们可以在内部更便宜地完成”估计时,不一定会估计或解释团队不会做的其他工作。与任何 DIY 项目一样,有些事情最好留给专家来做。
-
明确定义停机时间的含义
停机有多种版本;有计划的和无计划的。停机包括由平台不可用、应用程序崩溃、硬件故障、网络中断、物理数据中心问题、漏洞以及人为错误引起的问题。在某些评估中,客户和 IT 评估人员将注意力集中在平台的可用性上,而忽视了其他停机原因。例如,一家大型制造公司的项目经理讨论说,虽然云平台提供了更多的弹性、可靠性和冗余性,但它们并没有涵盖影响可用性的所有问题。他接着描述了许多评估人员忘记的导致停机的根本原因。
-
明确相关术语
最近,我加入了一个行业小组,讨论典型客户对应用程序可用性的需求。在最初的五分钟内,几位小组参与者就已经使用了十几个或更多不同术语的首字母缩略词和缩写词。虽然有些很容易理解,但其他一些则非常小众或基于 IT 专业人士的背景。例如:HA+DR。这就是高可用+灾难恢复或高可用性数据复制?首字母缩略词的使用,加上具有不同行业知识和经验水平的人之间对术语的不同使用,也会在购买过程中造成混乱和摩擦。作为客户体验副总裁,一位客户评估遇到了采购团队之间的严重摩擦,因为一位审批者认为公司只需要 HA 解决方案,而另一位则提到了 HA+DR。最后,两人意识到一个HA包含两个节点,另一个HA是两个节点加DR。
-
明确HA解决方案的作用
期望是另一个经常阻碍购买 HA 解决方案的因素。作为客户体验副总裁,我们与一位客户合作,该客户正在处理导致反复停机的平台和应用程序不稳定问题。在评估过程中,客户感叹HA方案未能解决平台不稳定问题。在负载下,硬件 CPU 和内存出现问题,网络变得不稳定,几乎无法使用。客户没有通过足够规模的系统或可靠的基础设施来解决底层平台问题,而是将故障归咎于 HA 解决方案,并走向了不同的方向。IT 管理员有时很难与管理层设定关于 HA 可以做什么和不能做什么的期望。HA 解决方案并不是解决所有 IT 基础设施问题的灵丹妙药,而是健全架构的重要组成部分。当对解决方案或要求的期望发生误解时,购买通常会受到阻碍或阻止。
-
解释为什么云 SLA 不提供应用程序 HA
查看您的云平台 SLA,并充分了解它们将涵盖和不涵盖的内容。许多平台为之前饱受诟病的数据中心提供了急需的基础设施稳定性、可靠性和灵活性。然而,对于大多数应用程序来说,可用性和正常运行时间的责任仍然由 IT 管理员而不是云供应商承担。无论您的系统位于何处、本地还是云端,都不存在“100% 放手”的 HA 方法。
当然,这并不是导致购买出色的 HA 解决方案变得困难的误解的完整列表。其他值得注意的误解经常发生在调度过程、用例的优先级、需求的定义和澄清、成功标准、预算、预算权限以及对不采用企业商业 HA 解决方案的风险的理解(或缺乏理解)中。联系SIOS了解有关我们 HA 解决方案的更多信息。
奖金:
消除组织各层之间的误解评估、购买和部署出色的 HA 解决方案的一个主要挑战是由于组织不同层之间的误解而出现的。回想一下第一组成本误解,并考虑每个负责成本合理性的人可能需要向老板解释以获得批准。现在考虑每个人老板的背景;他们是技术人员还是非技术人员,在同一团队还是组织的不同部分?现在考虑公司各个 IT 层之间的关系,以及他们的需求和沟通如何影响讨论和决策。SIOS 客户体验团队合作的许多公司的 IT 部门的每个部分都有多个技术团队;数据库、应用程序、平台、网络、安全等。每个技术团队都必须进行良好的沟通,以定义需求、期望和成功标准。这种级别的沟通并不容易发生,当所有团队都处于远程且位于不同时区时,这种沟通会变得更加困难。
-Cassius Rhue,客户体验副总裁
经许可转载安全操作系统