災難恢復
如何使用單個集群軟件解決方案實現災難恢復
通過災難恢復保護在物理、虛擬、雲或混合雲基礎架構的任意組合中運行的 Windows 或 Linux 應用程序
什麼是災難恢復?
災難恢復對持續業務運營至關重要
災難恢復 (DR) 是一種策略和一組策略、程序和工具,可確保關鍵 IT 系統、數據庫和應用程序在發生人為或自然災害時繼續運行並可供用戶使用。 雖然 IT 團隊擁有災難恢復策略,但 DR 是每個組織業務連續性計劃的重要組成部分,該計劃是一種策略以及一組策略、程序和工具,可在災難發生後使整個業務恢復正常運行。
但是,當我們談到災難時,它不一定是影響您業務的全面颶風、龍捲風、洪水或地震。 災難有多種形式,包括網絡攻擊、用戶錯誤、火災、盜竊、故意破壞,甚至恐怖襲擊。 簡而言之,災難是任何導致系統長期停機和/或大規模數據丟失並影響您的 IT 基礎設施、數據中心和業務的危機。
在最近的 Spiceworks民意調查,59% 的組織表示他們在一年內經歷了 1 到 3 次中斷(即 IT 相關服務正常水平的任何中斷),11% 的組織經歷了 4 到 6 次,7% 的組織經歷了 7 次或更多的。 此外,調查還表明,依賴更多服務的大型公司比小型組織更有可能遇到中斷。 例如,71% 的小型企業在過去 12 個月內經歷了一次或多次中斷,而中型企業和大型企業的這一比例分別為 79% 和 87%。 當您查看這些統計數據時,您就會知道如果您沒有適當的災難恢復計劃,您將生活在藉來的時間裡。
但有好消息。 與前幾年的統計數據相比,在製定災難恢復計劃方面,各種規模和各行各業的組織似乎都做得更好。 根據 Spiceworks 的同一項調查, 95%的組織製定了 DR 計劃,但不幸的是,23% 的組織從未測試或執行他們的計劃。 執行您的 DR 計劃與學生消防演習或集合演習一樣重要。 制定計劃只是第一步。 如果參與執行計劃的人不知道該怎麼做,您將無法從災難中恢復。
高可用性對比災難恢復
但在我們進一步討論之前,讓我們明確處理系統故障與災難的最佳實踐之間的區別。 要從系統故障中恢復,冗餘系統、軟件和數據應位於局域網 (LAN) 上。 對於關鍵數據庫應用程序,您可以跨 LAN 同步複製數據。 這使您的備用實例“熱”並與您的活動實例同步,因此它可以在發生故障時立即接管。 這被稱為高可用性 (HA) .
但是,要在發生災難時恢復系統、軟件和數據,意味著冗餘組件必須位於廣域網 (WAN) 上。 對於 WAN,數據複製是異步的,以避免對吞吐量性能產生負面影響。 這意味著對備用實例的更新將滯後於對活動實例的更新,從而導致恢復過程的延遲。 由於災難很少發生,一些延遲可能是可以容忍的,並且取決於 (a) 實現盡可能低的恢復時間目標 (RTO) 和恢復點目標 (RPO) 對您的業務有多重要,以及 (b) 您有多少預算可以分配以達到最佳的 RTO 和 RPO。
RTO 是任何中斷的最大可容忍持續時間,RPO 是災難發生時可容忍的最大數據丟失量。 對於災難恢復,一些解決方案通常需要幾分鐘甚至幾小時的 RTO,因為嘗試在短短幾分鐘內通過 WAN 進行恢復成本太高。 對於任務關鍵型應用程序,您的組織希望實現較低的 RPO,但 RPO 越低,您就越需要適當的流程來確保所有數據在故障轉移之前都已復製到備用服務器上。 這種努力往往會增加恢復時間。
但是使用 SIOS 災難恢復解決方案,您可以實現最小到無數據丟失的 RPO 和一到兩分鐘的 RTO。
SIOS 提供一種解決方案來滿足您的 HA 和 DR 需求
無論您需要單個站點內的本地 HA 還是跨多個站點的快速、高效的災難恢復,SIOS 解決方案都能滿足您的所有業務連續性需求。 |
這SIOS容災解決方案是一個多站點、地理上分散的集群,可提供數秒的 RPO 和數分鐘的 RTO。 SIOS 與許多其他災難恢復提供商的不同之處在於,它提供了一種解決方案,可同時滿足高可用性和災難恢復需求。
為了支持 DR,您可以按照與實現高可用性相同的方式配置集群,但有兩個之前討論過的明顯區別:
- DR 群集節點位於離 HA 實例較遠的地理位置(本地、虛擬或云中)中。
- DR 站點位於廣域網 (WAN) 上,這意味著數據複製將是異步的,以避免對吞吐量性能產生負面影響。
請記住,異步數據複製意味著對 DR 實例的更新將滯後對活動實例的更新,但通常最多只有幾秒鐘。 但藉助 SIOS 跨 WAN 的令人難以置信的快速數據複製,您可以在多個服務器和數據中心之間保持數據的實時副本同步,以實現 HA 和 DR。
除了用於 HA/DR 和實時數據複製的單一解決方案外,SIOS HA/DR 解決方案還提供:
- 塊級數據壓縮以最小化網絡負載
- 帶寬限制以調節和最小化網絡擁塞
- 廣域網優化以提高網絡性能
- 與一鍵式故障轉移集成以支持 DR 和自動故障轉移以支持 HA
- 一種不可知的平台方法,允許您選擇本地、虛擬、雲或混合 DR 解決方案
以下案例研究展示了使用 SIOS DataKeeper 在單個解決方案中提供 HA 和 DR。
——————————————————————————————————————————————————
在高級醫療中心啟用 HA 和 DR 保護
位於以色列的 ALYN 醫院是首屈一指的兒科康復健康中心,專門診斷和康復患有身體殘疾的嬰兒、兒童和青少年。 父母帶著他們的孩子從以色列和國外接受廣泛的醫療服務、輔助醫療和額外的最先進的康復服務。
尋找正確的解決方案
ALYN 醫院運營著各種應用程序——包括電子病歷 (EMR)、客戶關係管理 (CRM)、SQL Server 數據庫、Microsoft Exchange 和 Microsoft Office,以支持其臨床和行政運營。 作為醫療保健提供者,醫院受到嚴格的政府法規的約束,需要實施強有力的 DR 規定,以確保其關鍵任務應用程序的保護和可用性。 該醫院選擇 Hyper-V Replica 來支持其災難恢復策略,在本地運行兩個物理上分開的服務器機房,使運行在任何 Hyper-V 主機服務器上的所有關鍵虛擬機 (VN) 都可以復製到另一個房間的另一個機房。 不幸的是,這種配置不能滿足 RPO 和 RTO 要求,因此 IT 團隊開始研究其他選項。
在尋找合適的 DR 解決方案時,IT 團隊考慮了使用共享存儲的 Windows Server 故障轉移群集 (WSFC)。 不幸的是,ALYN 沒有適當的 SAN,而且由於預算限制,在兩個服務器機房中實施相同的 SAN 成本過高。 為此,ALYN 調查了第三方解決方案。
尋找第三方故障轉移聚類軟件, ALYN 建立了三個標準:
- 該解決方案必須與現有硬件配合使用。
- 該解決方案必須為所有醫院關鍵應用程序提供高可用性 (HA) 和災難恢復 (DR) 保護。
- 總擁有成本 (TCO) 必須符合部門有限的預算。
SIOS DataKeeper – 顯而易見的選擇
在評估了幾種不同的解決方案後,IT 人員選擇了 SIOS DataKeeper,該團隊將其描述為“以極低的總擁有成本提供運營商級功能”的解決方案,並在單個經濟高效的解決方案中提供 HA 和 DR。
SIOS DataKeeper 將實時、塊級數據複製與連續應用級監控和靈活的故障轉移/故障恢復策略結合在一個易於實施和管理的整體解決方案中。 DataKeeper 利用 WSFC 並保持與運行環境的兼容性,使 IT 團隊可以輕鬆快速了解如何使用該解決方案并快速完成所有應用程序的 HA 配置。
使用 DataKeeper,IT 團隊可以創建三節點 SANless故障轉移集群具有一個活動實例和兩個備用實例。 通過這種配置,ALYN 可以在不中斷操作的情況下持續更新系統和軟件,因為活動實例可以移動到三節點集群中的任何服務器,並在計劃的硬件和軟件維護期間保持完全保護。
此外,SIOS 可以與任何類型的存儲和廣域網優化的數據複製一起使用,從而簡化了 ALYN 遠程 DR 站點的實施。 為了保持高事務吞吐量性能,WAN 上的數據複製異步發生,但 SIOS DataKeeper 使用特殊技術來優化數據傳輸,允許 ALYN 實現苛刻的 RPO 和 RTO。
底線
如今,SIOS DataKeeper 正在為 ALYN 醫院的所有關鍵任務應用程序提供高可用性保護。 ALYN 醫院 IT 總監 Uri Inbar 評論道:“通過 SIOS,我們找到了一種解決方案,能夠以極低的總擁有成本提供運營商級的功能。 對我們來說,這是一個顯而易見的選擇。
ALYN Hospital 定期測試配置,定期更改活動和備用名稱,同時在計劃的軟件更新期間根據需要重定向數據複製。 應用程序繼續不間斷地運行。
——————————————————————————————————————————————————
關於 SIOS 災難恢復的最終想法
在 Windows 環境中,SIOS DataKeeper for Windows Server 提供標準版和更強大的集群版。SIOS DataKeeper 標準版為 Windows Server 環境中的災難恢復保護提供實時數據複製。SIOS DataKeeper 集群版與 Windows Server 故障轉移群集 (WSFC) 無縫集成,支持高可用性和災難恢復配置。
SIOS LifeKeeper 和 DataKeeper 支持所有主要的 Linux 發行版,包括 Red Hat Enterprise Linux、SUSE Linux Enterprise Server、CentOS 和 Oracle Linux,並適用於各種存儲架構。
有關 SIOS DataKeeper 或 SIOS LifeKeeper 的更多信息,請訪問以下參考資料:參考
- https://betanews.com/2019/05/28/disaster-recovery-sql-server/
- https://community.spiceworks.com/blog/3138-data-snapshot-how-well-equipped-are-businesses-to-bounce-back-from-disaster
- https://www.spiceworks.com/press/releases/spiceworks-study-reveals-one-in-four-companies-never-test-their-disaster-recovery-plan/
請參閱我們的白皮書:了解 SQL Server 選項的災難恢復