Date: 5 4 月, 2021
改善高可用性的五十種方法
我喜歡第二年的開始。好吧,大部分。我喜歡樂觀,神秘,潛力和希望,隨著日曆翻到另一年,它似乎已融入生活。但是,隨著時間的推移,還有一些弊端。每年新年的開始都會帶來____種做事的方式_____。我的收件箱裡總是滿是“減肥的二十種方法”。 “建立投資組合的十種方法。” “管理壓力的三個技巧。” “使用新iPhone的19種方法。”幾乎在生活和工作的每個領域,都有很多關於自我改善,文化轉變,壓力管理和減肥的清單,其中包括“改善家庭辦公室的十三種方法”。但是,高可用性又如何呢?您每個星期只有這麼多時間。 因此,您如何使HA解決方案比以往更高效,更可靠。您的清單在哪裡?這裡有五十種方法可以使您的高可用性體系結構和解決方案更好:
- 更快地從集群獲取更多信息
- 為關鍵監控指標設置警報
- 添加分析。乘以你的知識
- 從權威的角度建立簡潔的架構
- 連接更多資源。 與類似的合作夥伴和其他醫管局專業人員建立聯繫
- 聘請專門研究高可用性的顧問
- 現有覆蓋率的100倍。 擴大您的保護範圍
- 集中您的日誌和管理平台
- 刪除工作
- 刪除黑客和變通辦法
- 創建可靠的可重複解決方案架構
- 利用您的平台:公共,私有,混合或多雲
- 發現你的差距
- 搜索單點故障(SPOF)
- 拒絕實施不完整的解決方案
- 眾包創意和增強功能
- 進行商業化和專用
- 為每個生命週期階段製定明確的策略
- 澄清決策過程
- 記錄您的過程
- 記錄您的操作手冊
- 記錄您的架構
- 計劃人員輪換
- 計劃維護
- 進行定期維護(補丁,更新,安全修復)
- 定義和完善入職策略
- 明確責任
- 改善您的溝通渠道
- 與利益相關者過度溝通
- 在危機發生前實施危機解決方案
- 升級基礎架構
- 升級您的虛擬機; CPU,內存和IOP
- 在區域或區域級別添加冗餘
- 添加數據複製和災難恢復
- Go OS和Cloud不可知
- 獲得團隊培訓(雲,操作系統,HA解決方案等)
- 繼續訓練團隊
- 探索混亂測試
- 模仿一流的架構
- 要有創造力。創新擴展了您可以保護和自動化的範圍。
- 提高自動化程度
- 調整系統
- 多聽
- 實施嚴格的變更管理
- 部署質量檢查群集。在更新/升級生產之前測試所有內容
- 對任何故障進行根本原因分析練習
- 解決RCA和閉環糾正措施報告
- 第一次學習您的課程。重用關鍵的學習成果。
- 整理。不要在生產集群上運行不必要的服務或應用程序
- 堅持不懈。繼續努力。
那麼,您學到了什麼來增加和改善企業可用性的想法和方式呢? 讓我們知道!
-客戶體驗副總裁Cassius Rhue
轉載自SIOS