Date: 20 11 月, 2022
HA 和 DR 的簡單日子已經一去不復返了
翻閱電視頻道,我偶然發現了電影“他只是沒那麼喜歡你”和德魯·巴里摩爾 (Drew Barrymore) 的場景,講述了我們大多數人在 2022 年對技術,尤其是高可用性和災難恢復的感受:“我懷念那些日子你有一個電話號碼和一台答錄機,那台答錄機有一盒磁帶,而那一盒磁帶要么有一個人的留言,要么沒有。 現在你只需要四處檢查所有這些不同的門戶網站,就會被七種不同的技術拒絕。 太累了。”有時,您不希望只有一個雲,甚至沒有云平台嗎?一個數據庫運行在一個操作系統上;並且只需要擔心一個前端應用程序。 但是,世界已經發生了變化,而且發展得更快,也變得更加複雜。技術的進步、併購的影響以及我們 24/7 社會日益增長的胃口和節奏,數十億消費者正在尋找最新的交易和最好的體驗,這意味著簡單的日子已經一去不復返了。
關於您的可用性的 4 個硬道理
- 您的解決方案並不像您想像的那麼簡單
當然,您的企業環境並不簡單。您有遺留系統和應用程序,幾乎是自打孔卡以來就存在的那種。您擁有專為新一代應用程序和數據庫打造的新系統。此外,您擁有十年前創建的解決方案以彌合差距或跨越從一個平台遷移到另一個平台的時間,但儘管您盡了最大努力,這些系統仍然存在。 除了這些挑戰之外,還有越來越多的系統和 IT 資源來自於公司 U 的併購。在新時代交付 HA 並不像您想像的那麼簡單。
- 糟糕的架構是一個比你意識到的更大的問題
作為客戶體驗副總裁,我們已經看到了不良架構造成的損害。雖然部署 HA 軟件絕對有助於提高應用程序和數據庫的可用性,但 HA 軟件永遠無法完全克服不完整的需求、糟糕的網絡、缺少冗餘硬件或其他缺少的架構組件。我們的團隊曾經與一位客戶合作,以糾正在高峰運行時間導致系統不穩定的規模過小的環境。由於他們糟糕的架構,包括網絡和硬件不穩定,他們的團隊經常發現他們自己在爭先恐後地從可避免的停機問題中恢復過來。為了擁有一個完整、健全、高可用性和彈性的解決方案,您需要部署出色的軟件作為健全架構的一部分。
- 您的管理員需要的幫助比他們承認的要多
開發企業級、高度可用的彈性 HA 解決方案,建立在具有增長能力的可靠架構之上,並不是一個簡單的過程。針對彈性、應用程序和數據可用性進行設計和架構並不像從貨架上拿一盒蛋糕那麼容易。投入一系列工具、來自不同團隊的流程、混合的 SLA 以及各種操作系統、應用程序、數據庫和平台,您就有了需要幫助的秘訣。 最近,我採訪了一位在企業支持環境中工作 20 年的老手。他描述了他的許多同行,有時甚至是他自己,都無法承受維護關鍵企業可用性的重擔。您的管理員不僅在凌晨 2 點起床處理災難性的多系統、多應用程序、幾乎完全崩潰的數據中心時需要幫助,而且在企業可用性的日常辛勤工作中也需要幫助技術複雜的時代。
- 您的解決方案可能沒有您想像的那麼高可用
“雖然公共雲提供商通常會在其服務水平協議中保證一定程度的可用性,但這些 SLA 僅適用於雲硬件。”雲提供商 SLA 未涵蓋應用程序停機的許多其他原因,包括:
- 軟件問題和錯誤
- 人為錯誤
- 軟件故障
- 系統或應用程序掛起
作為客戶體驗副總裁,我們已經看到了一兩件事,包括遞歸例程中退出失敗導致的拒絕服務攻擊、系統耗盡、健康的關鍵應用程序的安全軟件隔離、內核恐慌以及隨機運行的虛擬機重啟。如果您的 HA 策略僅依賴於管理程序的 SLA,您的解決方案可能沒有您想像的那麼高可用。 您需要保護關鍵應用程序集群軟件可以監視和檢測問題,可靠地響應問題,並在必要時將操作轉移到備用服務器,以確保您的產品和服務在需要的時間和地點保持可靠和可用。
我們的單一數據中心變成了一系列的雲平台,跨越了幾十個數據中心。我們的 skunk work 應用程序已經成為我們必須跨 Windows、Linux 和一些不同的 *Nix 變種管理的關鍵前端、中間件和後端解決方案的一部分。技術的進步意味著我們的高可用性變得更加複雜,需要更好的架構。這也意味著我們的團隊需要更多幫助來管理這一切,如果我們不小心,可能意味著我們仍然容易受到攻擊和暴露。您的團隊面對的最多的是四個真相中的哪一個?
客戶體驗副總裁 Cassius Rhue 經許可轉載自信息系統