Date: 1月 9, 2022
修复您的云之旅
在某种程度上,2020 年和 2021 年改变世界的事件几乎重塑了我们所知道的一切,高可用性也不例外。 尽管关闭和限制,许多 IT 团队还是将本地数据中心换成了云。许多人都在问,“现在怎么办?”以下是解决 2022 年云之旅的五件事。
-
添加高可用性
在推动云计算的过程中,许多 IT 和业务领导者发现自己急于将服务和应用程序从因 COVID-19 而关闭的数据中心迁移到云中。 其他人涌向云端,不是因为数据中心关闭,而是为了应对需求爆炸的浪潮。 对于一些人来说,云之旅是如此之快,以至于 HA 不包括在内,现在他们发现了应用程序仍然在云中崩溃的艰难方式,意外中断和计划外停机仍然是 AWS、Azure 和GCP 与以前的数据中心一样多。
修复云之旅的第一步是添加一个C . 这对您的企业意味着几件事:
- 设计和构建高可用性和冗余架构
- 选择将保护关键组件和应用程序的软件和服务
- 定义和记录相关的流程和程序,以及至少最低限度的治理
- 为质量保证、程序测试和混沌测试部署生产副本
-
扩展以提高灾难恢复的可用性
当然,并不是每个人都在不考虑某种形式的 HA 的情况下迁移到云。 一些 IT 团队有先见之明,不会将 HA 留在本地,但在急于上云的过程中,他们将所有关键服务器都移到了同一个云可用区。 虽然拥有一些 HA 保护比完整的漏洞要好,但如果您只将服务器和应用程序部署在单个可用区 (AZ) 中,现在是时候为备用集群节点扩展到多可用区,甚至内置通过在不同区域部署第三个节点进行灾难恢复。 SIOS 已帮助数十家客户规划多可用区架构并添加灾难恢复解决方案。
-
建立你的团队
一夜之间,一些公司及其 IT 团队从完全本地化转变为与 Cloud Formation 模板、快速入门指南、IAM 角色、内部负载均衡器、覆盖 IP 以及破译 VM 大小的确切含义有关。现在是组建团队来支持云之旅的时候了。这将意味着几件事:
- 增加容量。除非您能够完成一个完整的提升和转变,否则您可能会拥有相同的员工来管理云和本地应用程序。传统解决方案以喜怒无常而著称,需要大量工作才能保持稳定和可用。要驾驭未来的云之旅,您需要能够满足可用性要求、了解云架构并为企业需求规划前进方向的能力。
- 通过培训提高技能。为您的团队提供云培训。要管理和规划课程,请通过有关云解决方案、架构、最佳实践和权衡的额外培训,寻找方法来增强组织内的 IT 卓越性。训练有素的员工不仅会在提高可用性方面获得红利,而且还会通过以经济、可扩展和合乎逻辑的方式解决可用性、维护和增长问题,从而获得红利。翻译:他们会在构建云基础架构的其余部分时避免浪费金钱。
-
集成自动化和分析
作为 SIOS Technology Corp. 的客户体验副总裁。 我曾与几家公司合作,这些公司在 2021 年迁移到云,而没有牺牲 HA、DR 或他们的团队。如果您认真对待达到所需的正常运行时间数(99.99%)并且制定灾难计划是不可协商的,那么是时候增加分析和额外监控的严格性了。 确保您的可用性解决方案具有应用程序感知自动化和编排功能,以便在发生灾难或计划外停机时进行恢复。 添加分析和自动化以巩固您的解决方案,并使您的云迁移从被动故障转移到主动通知和故障发生前的缓解。想象一下,如果应用程序性能不佳,或者延迟增加、错误或 VM 无响应行为及时得到通知,以避免在业务高峰期出现停机。 分析也很重要,因为它们可以揭示可能已经逃离原始可用性架构的系统和应用程序。
-
更新流程和治理
我们认为失败的许多事情都植根于过程的失败。 确保您组织的流程是最新的、有据可查的、适当的沟通和遵守。 这些流程应包含与谁、什么、何时、何地以及如何与客户相关的业务战略、目标和组织需求相关的一些关键最低要求。
确保您的新云环境的所有权和签核流程有据可查。 对于从获取基础架构的硬件团队转移到云团队的客户,我亲眼目睹了来自冲突、冲突或未解决的角色和责任的挫败感。 在迁移中糊涂是一组痛点,在没有明确治理的情况下从灾难中挖掘出来是一个更大、成本更高的问题。
如果您已经实现了向云的飞跃,那么留在那里并使其为您工作是旅程的下一部分。如果您的云之旅突然或崎岖不平,请考虑这五点来修复您的云之旅,并了解 SIOS 技术不仅可以帮助您提高云中的高可用性,还可以帮助您提高在云中运行的流程。
经授权转载西欧