Date: 28 9 月, 2021
開始很好,但保持正常運行時間需要警惕
作者 Isabella Poretsis 說:“開始一件事情很容易,完成它才是最大的障礙。”召開啟動會議真是太好了。它令人振奮,令人興奮。 經理和領導者興奮地看著綠地,樂觀情緒高漲。但是,這個開球時刻,甚至成功部署的香檳爆破時刻都只是開始。 保持正常運行時間需要持續保持警惕。
關鍵應用程序和數據庫的高可用性和難以捉摸的 4 個 9 正常運行時間不是一時發生的,而是要不斷努力結束破壞葡萄園的小狐狸。及時了解威脅、及時了解更新以及經過適當培訓和準備是您的團隊“永遠無權休假”的工作。
對於那些希望保持正常運行時間保持警惕的人,這裡有五個提示:
1. 監控環境
企業軟件中很少有人仍然遵循“設置並忘記它”的心態。一切,從你打開盛大的開瓶香檳的那一天到現在,一直在走向衰落的狀態。如果您沒有監控服務器、工作負載、網絡流量和硬件(虛擬或物理),您可能會失去正常運行時間和穩定性。
2. 執行維護
在二十多年的軟件開發和服務中,我一直注意到的一件事是所有軟件都帶有更新。應用它們。請記住執行合理的維護策略,包括獲取和驗證備份。 一位技術作家建議您唯一後悔的更新是您未能進行的更新。
3. 不斷學習
當我剛從 CE-211 實驗室實習時,我拔掉了實驗室服務器的令牌環的一端,這是我對高可用性的第一次介紹。幾分鐘後管理員就出現在我面前。聽完之後,他給了我一個教育。理想情況下,您和您的團隊希望在不關閉網絡的情況下學習,但您絕對希望繼續學習。查看有關現有技術、新版本、新興基礎設施的付費課程。檢查您的供應商,了解與您的流程、環境、軟件部署和公司企業相關的課程和項目。如果錢是一個問題,許多事情的免費課程也存在。
4. 乘以學習
除了不斷學習之外,還要製定一個成倍增長的學習計劃。作為 SIOS 的客戶體驗副總裁,我們看到了分享學習成果的團隊與不分享學習成果的團隊之間的巨大差異。分享他們的學習經驗的團隊避免了影響停機時間的知識差距。知道你學到了什麼的最好方法是把它教給別人。 在學習過程中,與團隊成員分享學習經驗,以減少因錯誤而導致停機的風險,並因此而休假。
5. 好好收場。 . .在下一個開始之前
所有項目、服務器和軟件都有結局。好收場。正確退役。通過關閉未完成的部分、記錄哪些進展順利、哪些不順利以及接下來要做什麼來開始下一個階段、部署、軟件關係等。善待您現有的供應商。您稍後可能會再次需要它們。在進行新部署之前了解現有系統和高可用性解決方案。這個正確的結局可以幫助你從一個更好的起點重新開始,走向更強大的結果。
保持系統高可用性是一個持續的過程。設置並忘記它是一個很好的口號,但現實是正常運行時間需要保持警惕、持續監控、適當維護和持續。
– 客戶體驗副總裁 Cassius Rhue 經許可轉載SIOS