Date: 25 5 月, 2022
高可用性、RTO 和 RPO
高可用性 (HA) 是一個信息技術術語,指的是在超過 99.99% 的時間內可運行且可用的計算機軟件或組件。 應用程序或系統的最終用戶每年的服務中斷時間少於 52.5 分鐘。 這種可用性級別通常是通過使用高可用性集群來實現的,這種配置通過使用冗餘服務器、網絡、存儲和軟件消除單點故障來減少應用程序停機時間。
什麼是恢復時間目標( RTO ) 和恢復點目標 ( RPO )?
除了 99.99% 的可用時間,高可用性環境還滿足嚴格的恢復時間和恢復點目標。 恢復時間目標( RTO ) 是從應用程序故障到恢復應用程序操作和可用性所用時間的度量。 這是衡量公司可以承受多長時間關閉該應用程序的指標。 恢復點目標( RPO ) 衡量在停機問題後應用程序可用性恢復時數據的最新程度。 它通常被描述為發生故障時可以容忍的最大數據丟失量。西歐高可用性集群提供RPO零和一個RTO分鐘。
什麼是高可用性集群?
在高可用性集群中,重要的應用程序運行在一個主服務器節點上,該節點連接到一個或多個輔助節點以實現冗餘。 集群軟件,如西歐LifeKeeper,監控集群應用程序和依賴資源,以確保它們在活動節點上運行。 系統級監控是通過集群節點之間的間隔心跳來完成的。 如果主服務器出現故障,則在超過心跳超時時間間隔後,從服務器啟動恢復。 對於應用程序級故障,集群軟件檢測到應用程序在活動節點上不可用。 然後,它將應用程序和相關資源在稱為故障轉移的過程中移動到輔助節點,在該過程中繼續運行並滿足嚴格的要求RTO s。
在傳統的故障轉移集群中,集群中的所有節點都連接到同一個共享存儲,通常是一個存儲區域網絡( SAN )。 故障轉移後,輔助節點被授予訪問共享存儲的權限,使其能夠滿足嚴格的RPO s。