Date: 7月 8, 2020
测试/质量保证系统是企业可用性的关键部分
“我可以吻你,”这就是三十年前一个朋友向我冲来时对我脱口而出的意思。在前往我们地区最大的乐队比赛之一的途中,她已将簧片放到萨克斯管上。我不知道它们是谁,但是当我看到一堆芦苇在公交车上的座位上时,我把它们捡起来,带他们去了暖身区。热身三分钟后,她的第一个簧片破裂了,当她伸手去拿空口袋进行替换时,她惊慌失措。当我找到我发现它们的管道时,她脱口而出:“我现在可以吻你。”
担任SIOS Technology Corp.客户体验副总裁 在可用性频谱的不同阶段,我与许多企业客户和合作伙伴一起工作感到非常独特和独特。有时,我有机会与最终客户一起解决问题,缓解问题和进行改进。在其他时候,我们的团队会与合作伙伴和客户积极合作,以设计和实现企业可用性,以保护其系统免于停机。最近的一次客户体验使我想起了大约30年前发生的一件事情,当时我的朋友脱口而出:“我可以吻你。”
我和我的团队正在打客户电话。通话从平时的欢愉,介绍和对客户企业环境的概述开始。通话30分钟后,一切进展顺利。他们的体系结构扎实,周到并且有据可查。他们的团队知识渊博,技术精湛,经验丰富。但是随后,客户暗示,由于节省了成本,他们将不打算维护专用的测试/质量系统。我深吸了一口气。 实际上,这更像是呼气,就像是从肠子上冲来的空气一样。我准备做出回应,但在此之前,我的声音就爆发了。 “停机的首要原因是缺乏流程,”合作伙伴代表架构师在与我们的电话中惊呼道。经过短暂的开玩笑,客户同意维护测试/ QA系统,我差点脱口而出:“我可以亲你!”
在许多企业部署的前线(新系统,数据中心迁移和系统更新)中,我在支持和服务部门的团队已经看到许多问题,这些问题可以通过利用测试系统/群集来解决。
测试/质量系统是避免停机的HA策略的重要组成部分。与维护企业部署相关的常见任务(例如补丁,更新和配置更改)存在风险。巨大的风险。
通常在生产中进行测试的风险包括几个严重的潜在灾难性问题:
- 数据损坏或无效
- 受保护的数据泄漏
- 错误的收入确认(取消的订单等)
- 重载系统
- 对其他生产系统的意外副作用或影响
- 错误率高,可触发警报并呼叫人员
- 偏斜的分析(流量漏斗,A / B测试结果等)
- 充满脚本和漫游器活动的不正确流量日志(a)
如果客户尝试在生产中进行风险较大的更改,则结果可能会非常有害。除了上面列出的那些故障之外,还有更多的停机时间风险,应用程序安装损坏,以及在某些情况下不可逆转的损坏。以客户X(在制造业中知名的SAP Enterprise商店)为例。
在从信誉良好的站点上读取紧急通知后,OS管理员迅速将其生产节点更新为可用的最新内核更新。在数小时内,生产节点开始了一系列未启动的崩溃和内核崩溃。他急忙安装了与他的配置不兼容的内核。现有应用程序软件包,设备,文件系统和相关软件包的组合。这导致生产中断,并向多个供应商几次高优先级升级。
将补丁程序应用于测试/ QA或沙箱系统时,可以管理和验证补丁程序和关键修订,以减少生产力损失和计划外停机。在类似生产的环境中测试应用程序使您能够发现无法预料的问题,并在这些问题对您的运营产生不利影响之前进行纠正。产前设计和测试消除了代价高昂的业务中断,改善了客户体验并保护了品牌。
使用测试质量检查系统改善生产可用性和过程
这些是使用测试/质量检查系统可以改善生产可用性和过程的基础知识。 与生产环境类似的受控环境(必须与生产环境尽可能相似)必须具有以下功能:
- 测试内核更新和安全更新
- 验证设置和配置调整
- 重现生产问题并测试软件更新和补丁
- 验证应用程序版本兼容性,并减少由于不兼容的更改而导致停机的风险
- 提供一个安全的空间来练习和修订上线,维护,中断和其他企业程序活动
- 在不影响企业客户的情况下培训新员工和团队成员
如果您具有用于部署关键企业可用性软件的测试/质量检查环境,我现在可以亲吻您。有了这种环境,您的团队就可以“测试,验证和验证(2)”体系结构,业务需求,用户场景,以及与与生产环境最相似的一个系统或一组系统的一般集成-您知道赚钱。当然,您仍然必须安排窗口来维护您的生产系统并对其进行测试,但是要在这之间完成一个安全的缓冲步骤之后。
—客户体验副总裁Cassius Rhue
————-
参考文献:
- https://opensource.com/article/19/5/dont-test-production已访问2020年5月4日
- https://www.softwaretestingclass.com/system-testing-what-why-how/访问时间:5/4/2020