Date: 7月 7, 2022
迪士尼和皮克斯灵魂的高可用性课程
在迪士尼和皮克斯的灵魂里,主角乔·加德纳(杰米·福克斯配音)梦想成为一名专业的爵士钢琴家。然而,尽管他做了很多尝试,但令他母亲失望的是,他发现自己离梦想很远,过着“中年中学乐队教师”的生活。但随后,“由于最后一刻有机会在爵士传奇人物多萝西娅·威廉姆斯的四重奏中演出,他的梦想似乎终于要成为现实。直到“一个重大的失误把他送到了伟大的前世——一个灵魂得到他们的兴趣、个性和怪癖的地方——乔被迫与一个“22”一起工作,一个对生活在地球上没有兴趣的古老灵魂,以“在为时已晚之前以某种方式返回地球( D23.com )。”迪斯尼和皮克斯的灵魂是一部伟大的电影,其中有许多有趣和相关的角色,幽默,描述性的,有时令人不安的相关性对生活、目的和生活的看法。但是,这也是一部有钱的电影领导力课程、生活课程和更高可用性的课程。
来自迪士尼和皮克斯灵魂的关于更高可用性的七个想法。
1.注意正在发生的事情
在迪斯尼和皮克斯的灵魂里,乔获得了他梦想中的演出。但当乔开始走路并分享这个好消息时,他正忙着玩手机,以至于他走到街上,差点被一大堆砖头压死,然后他危险地走向一个开放但明显标记的沙井。那么更高可用性的教训是什么——注意。注意来自监控和恢复解决方案的警报和错误消息。请注意您的托管服务提供商所做的更改,尤其是来自供应商、合作伙伴和安全团队的重要通知。警报和警告的存在是有原因的,当您看到警告时未能解决它们或采取适当的措施可能会导致您陷入深渊。
2.不要掉进坑里
对警告视而不见或无视警告,乔最终落入一个敞开的沙井并变成了灵魂。这立即改变了他的梦想和计划。那么,您的企业可能会陷入什么困境?您的企业发展道路上是否存在潜在漏洞,例如:覆盖漏洞、版本差距、维护计划和现实中的漏洞,甚至是供应商响应能力的黑洞?环顾您的环境,除了明显的单点故障之外,您还会陷入哪些漏洞?是否有警告表明您存在与未受保护的关键应用程序、团队之间的沟通差距,甚至是流程和危机管理中的漏洞相关的漏洞。不要掉入可能损坏甚至结束您的高可用性.
3.不要急于高可用
成为灵魂后,乔开始积极尝试回到自己的身体。当他与 22 配对时,她将他带到 Moonwind,后者同意尝试帮助他找到自己的尸体,他们照做了。但乔变得太急于跳回他的身体,尽管月风很谨慎。在他的匆忙中,他和 22 都掉到了地上,但乔最终进入了一只猫的身体,而 22 最终进入了他的身体。就像乔一样,如果我们没有耐心,跳跃发生得太快,我们最终会陷入危险甚至更糟的境地。我们可能不在猫的身体里,但我们也可能远离维持 HA 所需的最佳位置。跳得太快看起来像:
- 在没有架构或整体解决方案的情况下部署软件
- 无需在 QA 中测试即可在生产中部署
- 在不了解云或云对 HA 意味着什么的情况下部署到云中
- 根据时间线部署到生产环境中并且未完成验收测试
- 在没有专门构建的商业级应用程序监控和编排解决方案的情况下进行部署
4. 不要过早退出——高可用性绝非易事
当年轻的长号手康妮来到她老师的公寓时,她很沮丧,想辞职。她首先告诉乔(乔的身体实际上是 22 岁)她很沮丧,她只想放弃和退出。但片刻之后,她在长号上演奏了最后一首曲子,并意识到现在退出还为时过早。在更高的可用性中,我们都非常像 Connie。 有时,困难让我们觉得自己走到了尽头,想要退出。有时,中断会让我们确信是时候认输了。 不要那么快放弃。HA 绝非易事,绝非易事!但是,放弃努力结束停机时间总是为时过早,所以像康妮一样,也许我们只需要坚持下去。这引导我进入下一课。
5. 你还没有尝试一切
电影中的22是一个还没有活过的灵魂。她相信她已经尝试了所有可能的事情来给她一个火花,但是当她落入乔的身体时,她意识到有很多她没有尝试过。在创建更高可用性的解决方案时,很容易让人觉得您已经尝试了所有产品和每种产品,但很可能您还没有。全新的视角,或以全新的眼光看待挑战和问题,可能会帮助您提高系统和企业可用性。
尝试提高可用性的一些方法可能很简单,例如:
- 为关键监控指标设置附加警报
- 添加分析。
- 执行定期维护(补丁、更新、安全修复)
- 记录您的流程
- 记录您的操作手册
- 改善您的沟通渠道
- 进行定期维护
其他想法可能需要更多的工作、研究、时间和金钱,但如果你过去没有探索过它们可能是值得的。
通过更多时间和精力提高可用性的方法包括:
- 删除黑客和解决方法。
- 创建可靠的可重复解决方案架构
- 商业化和专门建造
- 聘请顾问
- 审核并记录您的架构
- 升级你的虚拟机; CPU、内存和 IOP
- 在区域或区域级别添加额外的冗余
6. 提出更多(更好)的问题
在扮演手套先生的乔不小心在头发中间剪了一条路后,手套先生和乔不得不去看看乔的理发师德兹。当乔和德兹坐在理发椅上时,他们开始谈论目的、生活、存在主义等等。理发后,22 询问 Dez 为什么他们以前从未有过这样的对话,关于 Dez 的生活。德兹回答说他以前从未问过。有时,我们可以如此专注于解决方案、云或本地方法、语言和架构,以及告诉别人我们在做什么,以至于我们忘记提出可以打开一个全新世界的问题。当乔问问题时,他对德兹和他自己有了更多的了解。也许更好的 HA 的教训是开始询问更多关于我们的解决方案、架构、业务目标和挑战、最终客户目标、我们的团队,甚至是我们在更大范围内的角色和职责的问题。
增加我们可用性的一些简单问题包括:
- 如果明天发生灾难,原因是什么系统、流程、产品或解决方案?
- 要保护的最重要的事情是什么?应用程序、数据、元数据,所有这些?
- 我们的应用程序和数据库可以容忍什么 RPO?
- 我们的客户不能容忍什么?
- 我错过了什么?
- 我们在哪里记录了这个架构?
- 我不明白什么?
7. 坚持有回报
“倒计时,”特里说。Terry 的任务是跟踪 The Great Beyond 的进入者,他正在仔细计算应该到达或已经到达的灵魂数量。乔绕道前世后,特里下定决心要找到失踪的灵魂并解决问题。 当他开始工作时,他正站在一条长长的文件柜走廊里,这些文件柜一直延伸到眼睛所能看到的高度。但过了一会儿,他找到了乔的档案,发现乔发现了一个漏洞,这就是计数被取消的原因。特里表现出的同样毅力也将在更高的可用性领域得到回报。面对令人生畏的不确定性、大量的日志文件和大量可能的故障场景,坚持不懈地在问题发生之前发现并解决问题,或者在问题发生后进行有效的分析和修复,这将引领我们走向更好我们想要的结果。同样,缺乏勤奋和毅力意味着同样的问题可能会在以后重新出现,即使在使用新软件的新环境中也是如此。
随着电影灵魂的结束,乔回到了伟大的过去,找到并说服 22 接受她的地球通行证并冒险。让人想起她和乔一起摔倒在地时,她又一次冒险。令我的孩子们沮丧的是,这部电影的结尾没有描述 22 对她的生活的看法或随之而来的新机会。她只是从伟大的过去中跳出来,期待接下来会发生什么。也许我们也正处于一个可以冒险的时刻……“伟大的前世”中的一个时刻,以及一个让这一年成为更高可用性的机会。
– Cassius Rhue,客户体验副总裁