23 6 月, 2022 |
什麼是“腦裂”以及如何避免它什麼是“腦裂”以及如何避免它正如我們所討論的,在一個高可用性集群環境中有一個活動節點和一個或多個備用節點,當活動節點發生故障或停止響應時,它們將接管服務。 在考慮節點之間的網絡層之前,這聽起來像是一個合理的假設。 如果節點之間的網絡路徑出現故障怎麼辦? 任何一個節點現在都不能與另一個節點通信,在這種情況下,備用服務器可能會在它認為活動節點發生故障的基礎上將自己提升為活動服務器。 這導致兩個節點都變得“活躍”,因為每個節點都會認為另一個節點已經死了。 結果,數據完整性和一致性受到損害,因為兩個節點上的數據都會發生變化。 這被稱為“裂腦” . 為避免出現腦裂情況,應在集群中安裝 Quorum 節點(也稱為“見證”)。 添加仲裁節點(到由偶數個節點組成的集群)會創建奇數個節點(3、5、7 等),節點投票決定哪個應該充當集群中的活動節點。 在下面的示例中,包含節點 B 的服務器機架丟失了局域網連接性。 在這種情況下,通過在集群環境中添加第 3 個節點,系統仍然可以確定哪個節點應該是活動節點。 Quorum/Witness 功能包含在西歐保護套件。 安裝時,在所有節點(不僅是仲裁節點)上選擇 Quorum / Witness,並在所有節點(包括仲裁節點)之間定義通信路徑。 仲裁節點不託管任何活動服務。 它的唯一作用是參與節點通信,以確定哪些是活動的,並在通信中斷的情況下提供“平局投票”。 西歐也支持IO 防護和存儲作為仲裁設備,在這些配置中不需要額外的仲裁節點。 經授權轉載西歐
|
19 6 月, 2022 |
節點之間的數據複製如何工作?節點之間的數據複製如何工作?在傳統的數據中心場景中,數據通常存儲在存儲區域網絡中( SAN )。 雲環境通常不支持共享存儲。 西歐DataKeeper 使用複制技術提供“共享”存儲,以創建當前活動數據的副本。 它創建一個作為 RAID1 設備工作的 NetRAID 設備(跨設備鏡像數據)。 數據更改從鏡像源(活動節點上的磁盤設備 – 下圖中的節點 A)複製到鏡像目標(備用節點上的磁盤設備 – 下圖中的節點 B)。 為了保證兩個設備之間數據的一致性,只有活動節點對複制的設備(下例中的 /datakeeper 掛載點)具有寫訪問權限。 當它是鏡像目標(即,在備用節點上)時,不允許訪問複製設備(/datakeeper 掛載點)。 經授權轉載西歐 |
15 6 月, 2022 |
客戶端如何連接到活動節點客戶端如何連接到活動節點如前所述,一旦高可用性集群已配置,兩個或多個節點同時運行,用戶連接到“活動”節點. 當活動節點上出現問題時,會發生“故障轉移”情況,“備用”節點將成為新的“活動”節點。 當發生故障轉移時,必須有一種機制允許客戶端檢測故障轉移條件並重新連接,或者將用戶的活動客戶端會話無縫傳輸到活動節點。 虛擬 IP 地址通常在配置集群並且客戶端與活動節點使用虛擬 IP 地址。 發生故障轉移時,虛擬 IP 地址會重新分配給新的活動節點,並且客戶端會重新連接到相同的虛擬 IP 地址。 例如,假設有兩個節點 A 和 B,其 IP 地址為10.20.1.10和10.20.2.10 . 在此示例中,我們將定義一個虛擬 IP 地址 10.20.0.10,應將其視為分配給當前活動節點。 這類似於為一個節點上的一個網絡接口卡分配第二個 IP 地址。 如果命令ipa在活動節點上輸入,兩個 IP 地址都將出現(如本 Linux 示例中的第 10 行和第 12 行): 這ARP協議當客戶端嘗試使用 IP 地址查找服務器時,客戶端通常使用ARP (地址解析協議)找到蘋果電腦(媒體訪問控制)目標機器的地址。 一旦客戶端廣播一條消息以找到目標 IP 地址,活動節點就會用它的蘋果電腦地址和客戶端解析請求並連接到它。 ARP雲環境的替代方案但是,在雲環境中,無法使用以下方法識別活動節點ARP在虛擬環境中抽象了盡可能多的層。 可能需要基於在特定雲環境中使用的網絡基礎設施的替代方法。 通常有幾個選項,應從以下列表中進行選擇。 經授權轉載西歐
|
11 6 月, 2022 |
公有云平台及其網絡結構差異公有云平台及其網絡結構差異有幾個公共雲平台包括亞馬遜網絡服務( AWS )、微軟 Azure 和谷歌云。 儘管它們的基礎架構有許多相似之處,但也存在一些差異。 在許多情況下專有網絡(虛擬私有云)或網絡創建與區域綁定的(虛擬網絡)。 一個或多個專有網絡s 可以為一組邏輯應用程序定義。 通過這樣做,不同的系統被劃分為單獨的未連接網絡,除非不同專有網絡s 是專門連接的。 下一個專有網絡可以定義許多不同的子網。 根據目的,一些子網被配置為互聯網可訪問的“公共”子網,而一些被配置為互聯網不可訪問的“私有”子網。 一些雲提供商(如 Azure 和 Google Cloud)允許跨可用區(不同的數據中心)定義子網,而一些(如AWS ) 不允許跨可用區定義子網。 在後一種情況下,需要為每個可用區定義一個子網。 在本指南中,我們將為每個節點使用不同的可用區。 一旦基本功能西歐了解產品,探索不同的場景(類似於在您自己的網絡基礎設施中使用的場景)可能是合適的,這些場景涉及跨不同子網分佈工作負載、修改這些子網的 IP 範圍、改變網絡連接到的方式互聯網等 經授權轉載西歐
|
7 6 月, 2022 |
遷移到雲環境時應如何分配工作負載遷移到雲環境時應如何分配工作負載在考慮到高可用性的情況下遷移到公共雲時,確定工作負載(節點)的分佈方式是一個常見的討論主題。 如果工作負載位於本地環境中,則這些工作負載的位置通常由已建立的數據中心的位置定義。 在許多情況下,選擇另一個位置來託管工作負載並不是一個可用的選項。 借助公共雲產品,可以選擇廣泛的地理區域和可用區。 可用區通常類似於位於同一物理區域(例如加利福尼亞州)的一個或多個數據中心(物理位置)。 這些數據中心可能位於不同的區域,但使用高速網絡連接以最大限度地減少它們之間的連接延遲。 (請注意,跨可用性區域內的多個數據中心的託管服務應該對用戶透明)。 作為一般規則,工作負載之間的物理距離越大,環境的彈性就越大。 地震等自然災害不會同時影響不同地區(例如美國西海岸和東海岸)是一個合理的假設。 但是,由於系統範圍的故障,仍然有可能同時發生跨區域的服務中斷(一些雲提供商之前曾報告過同時發生跨區域中斷,例如美國和澳大利亞)。 考慮創建跨不同雲提供商定義的 DR(災難恢復)計劃可能是合適的。 另一個值得考慮的觀點是保護資源的成本。 通常,工作負載之間的距離越大,數據傳輸的成本就越高。 在許多情況下,同一數據中心(可用區)內節點之間的數據傳輸是免費的,而跨可用區傳輸數據的成本可能為 0.01 美元/GB 或更多。 當數據跨區域傳輸時,這一額外成本可能會翻倍(或更多)(即 0.02 美元/GB)。 此外,由於工作負載之間的物理距離增加,預計節點之間的數據延遲會更大。 綜合考慮這些因素,一般來說,建議將工作負載分佈在同一 Region 內的可用區之間。 經授權轉載西歐
|