修复您的云之旅

Date: 1月 9, 2022

在某种程度上，2020 年和 2021 年改变世界的事件几乎重塑了我们所知道的一切，高可用性也不例外。尽管关闭和限制，许多 IT 团队还是将本地数据中心换成了云。许多人都在问，“现在怎么办？”以下是解决 2022 年云之旅的五件事。

添加高可用性

在推动云计算的过程中，许多 IT 和业务领导者发现自己急于将服务和应用程序从因 COVID-19 而关闭的数据中心迁移到云中。其他人涌向云端，不是因为数据中心关闭，而是为了应对需求爆炸的浪潮。对于一些人来说，云之旅是如此之快，以至于 HA 不包括在内，现在他们发现了应用程序仍然在云中崩溃的艰难方式，意外中断和计划外停机仍然是 AWS、Azure 和GCP 与以前的数据中心一样多。

修复云之旅的第一步是添加一个C . 这对您的企业意味着几件事：
- 设计和构建高可用性和冗余架构
- 选择将保护关键组件和应用程序的软件和服务
- 定义和记录相关的流程和程序，以及至少最低限度的治理
- 为质量保证、程序测试和混沌测试部署生产副本
扩展以提高灾难恢复的可用性

当然，并不是每个人都在不考虑某种形式的 HA 的情况下迁移到云。一些 IT 团队有先见之明，不会将 HA 留在本地，但在急于上云的过程中，他们将所有关键服务器都移到了同一个云可用区。虽然拥有一些 HA 保护比完整的漏洞要好，但如果您只将服务器和应用程序部署在单个可用区 (AZ) 中，现在是时候为备用集群节点扩展到多可用区，甚至内置通过在不同区域部署第三个节点进行灾难恢复。 SIOS 已帮助数十家客户规划多可用区架构并添加灾难恢复解决方案。
建立你的团队

一夜之间，一些公司及其 IT 团队从完全本地化转变为与 Cloud Formation 模板、快速入门指南、IAM 角色、内部负载均衡器、覆盖 IP 以及破译 VM 大小的确切含义有关。现在是组建团队来支持云之旅的时候了。这将意味着几件事：
- 增加容量。除非您能够完成一个完整的提升和转变，否则您可能会拥有相同的员工来管理云和本地应用程序。传统解决方案以喜怒无常而著称，需要大量工作才能保持稳定和可用。要驾驭未来的云之旅，您需要能够满足可用性要求、了解云架构并为企业需求规划前进方向的能力。
- 通过培训提高技能。为您的团队提供云培训。要管理和规划课程，请通过有关云解决方案、架构、最佳实践和权衡的额外培训，寻找方法来增强组织内的 IT 卓越性。训练有素的员工不仅会在提高可用性方面获得红利，而且还会通过以经济、可扩展和合乎逻辑的方式解决可用性、维护和增长问题，从而获得红利。翻译：他们会在构建云基础架构的其余部分时避免浪费金钱。
集成自动化和分析

作为 SIOS Technology Corp. 的客户体验副总裁。我曾与几家公司合作，这些公司在 2021 年迁移到云，而没有牺牲 HA、DR 或他们的团队。如果您认真对待达到所需的正常运行时间数（99.99%）并且制定灾难计划是不可协商的，那么是时候增加分析和额外监控的严格性了。确保您的可用性解决方案具有应用程序感知自动化和编排功能，以便在发生灾难或计划外停机时进行恢复。添加分析和自动化以巩固您的解决方案，并使您的云迁移从被动故障转移到主动通知和故障发生前的缓解。想象一下，如果应用程序性能不佳，或者延迟增加、错误或 VM 无响应行为及时得到通知，以避免在业务高峰期出现停机。分析也很重要，因为它们可以揭示可能已经逃离原始可用性架构的系统和应用程序。
更新流程和治理

我们认为失败的许多事情都植根于过程的失败。确保您组织的流程是最新的、有据可查的、适当的沟通和遵守。这些流程应包含与谁、什么、何时、何地以及如何与客户相关的业务战略、目标和组织需求相关的一些关键最低要求。

确保您的新云环境的所有权和签核流程有据可查。对于从获取基础架构的硬件团队转移到云团队的客户，我亲眼目睹了来自冲突、冲突或未解决的角色和责任的挫败感。在迁移中糊涂是一组痛点，在没有明确治理的情况下从灾难中挖掘出来是一个更大、成本更高的问题。

如果您已经实现了向云的飞跃，那么留在那里并使其为您工作是旅程的下一部分。如果您的云之旅突然或崎岖不平，请考虑这五点来修复您的云之旅，并了解 SIOS 技术不仅可以帮助您提高云中的高可用性，还可以帮助您提高在云中运行的流程。

经授权转载西欧

修复您的云之旅

Date: 1月 9, 2022

修复您的云之旅

添加高可用性

扩展以提高灾难恢复的可用性

建立你的团队

集成自动化和分析

更新流程和治理