Date: 4月 5, 2021
改善高可用性的五十种方法
我喜欢第二年的开始。好吧,大部分。我喜欢乐观,神秘,潜力和希望,随着日历翻到另一年,它似乎已融入生活。但是,随着时间的推移,存在一些不利因素。每年新年的开始都会带来____种做事的方式_____。我的收件箱里总是满是“减肥的二十种方法”。 “建立投资组合的十种方法。” “管理压力的三个技巧。” “使用新iPhone的19种方法。”几乎在生活和工作的每个领域,都有很多关于自我改善,文化转变,压力管理和减肥的清单,其中包括“改善家庭办公室的十三种方法”。但是,高可用性又如何呢?您每个星期只有这么多时间。 因此,您如何使HA解决方案比以往更高效,更可靠。您的清单在哪里?这里有五十种方法可以使您的高可用性体系结构和解决方案更好:
- 更快地从集群获取更多信息
- 为关键监控指标设置警报
- 添加分析。乘以你的知识
- 从权威的角度建立简洁的架构
- 连接更多资源。 与类似的合作伙伴和其他医管局专业人员建立联系
- 聘请专门研究高可用性的顾问
- 现有覆盖率的100倍。 扩大您的保护范围
- 集中您的日志和管理平台
- 删除工作
- 删除黑客和变通办法
- 创建可靠的可重复解决方案架构
- 利用您的平台:公共,私有,混合或多云
- 发现你的差距
- 搜索单点故障(SPOF)
- 拒绝实施不完整的解决方案
- 众包创意和增强功能
- 进行商业化和专用
- 为每个生命周期阶段制定明确的策略
- 澄清决策过程
- 记录您的过程
- 记录您的操作手册
- 记录您的架构
- 计划人员轮换
- 计划维护
- 进行定期维护(补丁,更新,安全修复程序)
- 定义和完善入职策略
- 明确责任
- 改善您的沟通渠道
- 与利益相关者过度沟通
- 在危机发生前实施危机解决方案
- 升级基础架构
- 升级您的虚拟机; CPU,内存和IOP
- 在区域或区域级别添加冗余
- 添加数据复制和灾难恢复
- Go OS和Cloud不可知
- 获得团队培训(云,操作系统,HA解决方案等)
- 继续训练团队
- 探索混乱测试
- 模仿一流的架构
- 要有创造力。创新扩展了您可以保护和自动化的范围。
- 提高自动化程度
- 调整系统
- 多听
- 实施严格的变更管理
- 部署质量检查群集。在更新/升级生产之前测试所有内容
- 对任何故障进行根本原因分析练习
- 解决RCA和闭环纠正措施报告
- 第一次学习您的课程。重用关键的学习成果。
- 整理。不要在生产集群上运行不必要的服务或应用程序
- 坚持不懈。继续努力。
那么,您学到了什么来增加和改善企业可用性的想法和方法是什么? 让我们知道!
-客户体验副总裁Cassius Rhue
转载自SIOS