Date: 18 1 月, 2019
動態利用率將使高可用性更加經濟實惠,進一步推動向雲遷移
雲中的按需配置並不是什麼新鮮事。對於混合和純公共雲配置中的高可用性和災難恢復,新功能將是更具成本效益的選擇。這種按需HA和DR將利用在多個數據中心和地理區域之間傳播的資源的動態利用,並使更多應用程序實現更高的服務水平。
HA和DR都需要冗餘以確保從故障中可靠,快速地恢復。
HA故障轉移群集複製主VM的完整操作環境,包括輔助VM中的CPU,內存和存儲資源。然後,所有數據也會實時復製到輔助服務器,輔助服務器將保持空閒狀態,除非並且直到主服務器發生故障。擁有一個或多個完全冗餘的輔助虛擬機會創建一個有效處於持續自檢狀態的集群,從而確保它為自動和快速故障轉移做好準備。
相比之下,基本DR配置缺乏快速故障轉移所需的功能
例如,考慮Azure Site Recovery。微軟將ASR定位為DR-as-a-service。不斷增長的DRaaS市場現在包括來自近十幾家提供商的產品。使用ASR,主VM將復製到其他Azure區域中的輔助節點,或從本地實例複製到Azure雲。但數據並未實時復制。 該服務無法從應用程序級別停機的多種原因中自動檢測和故障轉移。
基礎問題
DRaaS和其他雲可用性服務根本沒有涵蓋許多潛在的故障點。通常,檢測到完全丟失服務。但是,未檢測到應用程序或OS軟件導致的故障,以及網絡或存儲等離散資源的故障。因此,應用程序服務可能會中斷 – 可能會延長一段時間 – 而不會被云自己的恢復設施檢測到。
SIOS技術的SIOS DataKeeper和SIOS Protection Suite
當高可用性至關重要時,全面的故障檢測對於避免應用程序級別的停機時間至關重要。使用專門構建的故障轉移群集技術可輕鬆實現此目標,例如SIOS Data的SIOS DataKeeper和SIOS Protection Suite,它能夠自動檢測軟件和底層物理和虛擬資源中的各種停機原因。這些僅限軟件的群集分佈在雲端,以提供完整的HA / DR解決方案,包括數據複製,持續的應用程序級監控和可配置的故障轉移/故障恢復恢復策略。
DRaaS產品
故障轉移群集軟件可以單獨配置為HA或DR,也可以配置為HA和DR的組合。DR通常在稱為GeoCluster的配置中的另一個區域中具有備用VM。與DRaaS產品一樣,WAN帶寬限制會導致數據出現“複製滯後”,並可能在某些故障情況下導致某些數據丟失。但與DRaaS不同,雲平台和應用程序級別會自動檢測到大類故障,並可立即糾正以確保服務連續性。雖然故障轉移群集具有最小化恢復點和恢復時間目標(RPO / RTO)的能力,與DRaaS相比提供全面的服務保護,但仍需要完全配置昂貴的冗餘和空閒資源。幸運的是,新興的集群管理技術正在解決這個問題,這些技術可以通過在發生故障時動態分配資源來協調完全恢復。
一種新方法
備用VM在待機模式下運行時,僅配置了處理主VM數據複製目標的極簡主義角色所需的資源。發生故障時,群集會立即動態地重新配置備用VM,並提供完整的資源補充,以提供其主VM全面運行角色所需的性能級別。這種動態利用使HA和DR保護能夠從顯著的成本節約中受益,而不會犧牲群集的可用性和可靠性優勢。
結論
無論是單獨運行還是協同運行,HA故障轉移群集和DRaaS都可以發揮作用,使HA和DR保護的連續性對於全系列企業應用程序來說更加經濟實惠 – 從那些可以容忍一些數據丟失和延長在所有可能的故障情況下,需要RPO為零(無數據丟失)且RTO小於5分鐘的停機時間。
關於作者
Jerry Melnick是SIOS Technology的總裁兼首席執行官,負責指導整體公司戰略並領導公司的持續增長和擴張。他在企業和高可用性軟件市場擁有超過25年的經驗。在加入SIOS之前,他是Marathon Technologies的首席技術官,負責公司的容錯解決方案的業務和產品戰略。他的經驗還包括PPGx,Inc。和Belmont Research的管理職位,負責建立一個專注於提供數據倉庫和分析工具的尖端軟件產品和諮詢業務。Jerry的職業生涯始於Digital Equipment Corporation,他領導的是一個創業型業務部門,提供高度可擴展的關鍵任務數據庫平台,以支持醫療,金融和電信市場中的企業計算環境。他擁有伯洛伊特學院理學學士學位,畢業於波士頓大學計算機工程和計算機科學專業。