Date: 9月 28, 2021
开始很好,但保持正常运行时间需要警惕
作者 Isabella Poretsis 说:“开始一件事情很容易,完成它才是最大的障碍。”召开启动会议真是太好了。它令人振奋,令人兴奋。 经理和领导者兴奋地看着绿地,乐观情绪高涨。但是,这个开球时刻,甚至成功部署的香槟爆破时刻都只是开始。 保持正常运行时间需要持续保持警惕。
关键应用程序和数据库的高可用性和难以捉摸的 4 个 9 正常运行时间不是一时发生的,而是要不断努力结束破坏葡萄园的小狐狸。及时了解威胁、及时了解更新以及经过适当培训和准备是您的团队“永远无权休假”的工作。
对于那些希望保持正常运行时间保持警惕的人,这里有五个提示:
1. 监控环境
企业软件中很少有人仍然遵循“设置并忘记它”的心态。一切,从你打开盛大的开瓶香槟的那一天到现在,一直在走向衰落的状态。如果您没有监控服务器、工作负载、网络流量和硬件(虚拟或物理),您可能会失去正常运行时间和稳定性。
2. 执行维护
在二十多年的软件开发和服务中,我一直注意到的一件事是所有软件都带有更新。应用它们。请记住执行合理的维护策略,包括获取和验证备份。 一位技术作家建议您唯一后悔的更新是您未能进行的更新。
3. 不断学习
当我刚从 CE-211 实验室实习时,我拔掉了实验室服务器的令牌环的一端,这是我对高可用性的第一次介绍。几分钟后管理员就出现在我面前。听完之后,他给了我一个教育。理想情况下,您和您的团队希望在不关闭网络的情况下学习,但您绝对希望继续学习。查看有关现有技术、新版本、新兴基础设施的付费课程。检查您的供应商,了解与您的流程、环境、软件部署和公司企业相关的课程和项目。如果钱是一个问题,许多事情的免费课程也存在。
4. 乘以学习
除了不断学习之外,还要制定一个成倍增长的学习计划。作为 SIOS 的客户体验副总裁,我们看到了分享学习成果的团队与不分享学习成果的团队之间的巨大差异。分享他们的学习经验的团队避免了影响停机时间的知识差距。知道你学到了什么的最好方法是把它教给别人。 在学习过程中,与团队成员分享学习经验,以减少因错误而导致停机的风险,并因此而休假。
5. 好好收场。 . .在下一个开始之前
所有项目、服务器和软件都有结局。好收场。正确退役。通过关闭未完成的部分,记录哪些进展顺利,哪些不顺利,以及接下来要做什么,开始下一个阶段、部署、软件关系等。善待您现有的供应商。您稍后可能会再次需要它们。在进行新部署之前了解现有系统和高可用性解决方案。这个正确的结局可以帮助你从一个更好的起点重新开始,走向更强大的结果。
保持系统高可用性是一个持续的过程。设置并忘记它是一个很好的口号,但实际情况是正常运行时间需要保持警惕、持续监控、适当维护和持续。
– 客户体验副总裁 Cassius Rhue 经许可转载SIOS