12 4 月, 2024 |
災難復原解決方案:如何處理“建議”與“要求”災難復原解決方案:如何處理“建議”與“要求”假設您遇到問題雲端叢集環境,並且您必須聯絡您的應用程式供應商之一才能解決該問題。他們為您提供了解決方案,但他們在回覆中指出,「不建議」配置這些系統的方式。您如何處理這些資訊?畢竟,到目前為止,一切都運作良好,並且可能需要大量時間和資源才能以「推薦」方式重新配置它們。另一方面,供應商推薦它肯定是有原因的,對吧?如果它會導致其他併發症怎麼辦?讓我們來看看建議的具體構成,以及從接受的任何一方處理建議的方法。 容災方案推薦配置您應該開始考慮如何處理建議,從字面上理解它,定義為「關於最佳行動方案的建議或提議」。我們已經可以在這裡看到一些提示,說明我們如何使用“建議”和“提案”一詞來識別它們。從這個角度來看,很容易拒絕供應商的推薦,因為它不方便,或者可能被認為是不必要的。 然而,在對建議採取任何行動之前,請確保更務實地審視它。畢竟,供應商建議這種特殊的配置是有原因的。他們對你的成功就像你對持續關係的一部分一樣感興趣,所以它肯定會帶來某種積極的好處。如果沒有建議的配置,您可能更容易出現某些類型的錯誤。這也可能是性能下降的情況,一切正常,但可能會工作得更好或更快。考慮到這一點,現在投入時間和精力來滿足這些建議,而不是在您受到不遵循建議的缺點的影響後才開始這樣做,不是更好嗎? 如何處理建議之外的災難復原解決方案配置現在,我們可以透過匯集討論的兩端來建構我們對建議的全面看法。總結的版本是:「不遵循供應商的建議也沒關係,只要您知道為什麼建議這樣做並接受這樣做的潛在缺點」。關鍵的第一步始終是與供應商交談。向他們詢問為什麼推薦它、擁有它與不擁有它的影響、他們是否有任何方法或程序可以輕鬆過渡到推薦的環境,以及您能想到的任何其他可以幫助您更好地了解自己和內部團隊的資訊.一旦您了解了影響,如果您有適當的理由,您就可以拒絕它。拒絕建議的一個很好的理由是出於安全目的。也許推薦的環境會關閉或規避您已採取的某些安全措施,因此使用該環境不僅會讓您更容易受到攻擊,而且還可能導致違反SLA、合作夥伴協議或您必須遵守的標準。在這種情況下,您可以告知供應商您不遵循建議配置的原因。這對供應商也非常有利,因為他們可以接受此回饋,並在未來實施改進,從而同時實現建議的配置和安全措施。如前所述,他們也為您的成功進行了投資,因此這對每個人來說都是雙贏。 災難復原解決方案要求但有時,對供應商告訴您的內容說「不」並不那麼容易。這就是從供應商「建議」到供應商「要求」的跨越邊界,這是不可避免的。當它作為一項要求呈現給您時,您就無法拒絕遵循它。儘管如此,與建議一樣,重要的是要了解為什麼它是一項要求,以及它實際上是什麼要求。作為您與供應商商定的 SLA 或產品、應用程式或服務的 TSA 的一部分,可能需要某些實踐。在這些情況下,確實必須做出滿足此要求所需的變更。需求通常也屬於技術方面。例如,磁碟大小、I/O 容量或可用電腦資源的規範,僅舉幾例。這些往往是應用程式按預期工作所必需的,因此確保滿足這些要求的價值是顯而易見的。 災難復原解決方案的靈活性僅僅因為您必須遵守要求並不意味著您必須簡單地辭職。理解為什麼要製定這項要求仍然具有很大的價值。與推薦一樣,與您的供應商交談至關重要。也許您不喜歡該要求的原因源於誤解,與您的供應商討論原因可以揭示這一點並消除一些擔憂。同樣,您對這些要求的回饋對於您的供應商改進產品或服務非常重要,並幫助他們了解您所看到的以不同方式做某事的價值。所需要的只是啟動一個對話框。 SIOS 高可用性和災難復原SIOS科技公司提供高可用性和災難復原透過針對最重要應用程式的叢集管理來保護和最佳化 IT 基礎架構的產品。今天聯繫我們有關我們的服務和專業支援的更多資訊。 經許可轉載安全作業系統 |
||||||||||||||||||||||||||||
6 4 月, 2024 |
在 Linux 上使用 SIOS LifeKeeper 設定 NFS 檔案見證的逐步指南在 Linux 上使用 SIOS LifeKeeper 設定 NFS 檔案見證的逐步指南SIOS Lifekeeper 和基於 NFS 的文件見證入門在高可用集群,見證人對於保證集群的完整性和可靠性起著至關重要的作用。沒有第三個節點,可能很難達到法定人數,因為沒有數據可以幫助打破兩個節點都認為應該上線的平局(這稱為裂腦)。您可以透過多種方式解決此問題,例如,透過提供專用見證伺服器、整個叢集可見的共用儲存路徑,或簡單地透過在叢集本身中擁有更多節點(至少 3 個!)。值得慶幸的是,SIOS 生命守護者為在 Linux 環境中設定高可用性叢集提供了強大的解決方案,並且配置見證以提高仲裁是一項重要功能。 在本指南中,我們將引導您完成在 Linux 上使用 SIOS LifeKeeper 設定基於 NFS 的檔案見證的步驟,幫助您增強叢集應用程式的可用性和彈性。 目標:使用基於 NFS 的儲存見證實現 2 節點集群,如下圖所示: 先決條件:開始之前,請確保您具備以下條件:
步驟 1:安裝/修改 SIOS LifeKeeper:我們需要在此階段安裝 LifeKeeper 或重新執行安裝程式以新增 Witness 功能,除非您之前已包含它。 就我而言,我使用的是 RHEL8.8,因此我將在使用 RHEL8.8 所需的補充包運行安裝之前安裝 ISO。 [root@server1-LK ~]# mount /root/sps.img /mnt/loop -t iso9660 -o 循環
[root@server1-LK ~]# cd /mnt/loop/
[root@server1-LK 循環]# ./setup –addHADR /root/HADR-RHAS-4.18.0-477.10.1.el8_8.x86_64.rpm
這裡,我們目的的重要部分是啟用見證功能,如下面的螢幕截圖所示。但是,您還需要一個額外的許可證文件,您可以在此處添加該文件,也可以稍後透過命令列新增: 否則,根據您的目的配置 LifeKeeper,或者如果已經配置,只需在包含「使用仲裁/見證功能」選項後繼續完成設定即可。 如果您決定透過命令列新增許可證,請在叢集中的每個節點上執行以下命令,並使用許可證檔案的正確路徑: [root@server1-LK ~]# /opt/LifeKeeper/bin/lkkeyins /<許可證文件路徑>l/quorum-disk.lic
步驟 2:設定並掛載共用儲存:確保叢集中的所有伺服器都可以存取共用儲存。您可以使用“mount”命令或“findmnt”檢查每個伺服器,以驗證是否已在本機安裝: [root@server1-LK 循環]# mount | grep NFS
/var/lib/nfs/rpc_pipefs 上的 sunrpc 類型 rpc_pipefs (rw,relatime) 172.16.200.254:/var/nfs/general on /nfs/general 類型 nfs4 (rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255,hard, 或者 [root@server1-LK ~]# findmnt -l /nfs/general
目標來源 FSTYPE 選項 /nfs/general 172.16.200.254:/var/nfs/general nfs4 rw,relatime,vers=4.2,rsize=1048576, 如果您仍需要自行掛載共享,請依照以下步驟操作: 首先,確認您可以在主機伺服器上看到 NFS 共用。 [root@server1-LK ~]# showmount -e 172.16.200.254
172.16.200.254 的導出清單: /首頁172.16.205.244,172.16.205.151 /var/nfs/一般 172.16.205.244,172.16.205.151 就我而言,我想掛載“/var/nfs/general”共享。 要掛載此共享,首先請確保您計劃掛載的目錄存在。如果沒有,請創建它: [root@server1-LK ~]# mkdir -p /nfs/general
現在,您可以使用以下命令手動掛載共享以確認可以連接,並且它可以工作: [root@server1-LK ~]# mount 172.16.200.254:/var/nfs/general /nfs/general
最後,一旦滿意,將掛載點添加到您的 /etc/fstab 檔案中,以便它將在啟動時掛載: [root@server1-LK ~]# cat /etc/fstab
# # /etc/fstab # 由 anaconda 創建於 2024 年 1 月 25 日星期四 12:07:15 # # 透過引用,可存取的檔案系統維護在「/dev/disk/」下。 # 有關更多信息,請參閱手冊頁 fstab(5)、findfs(8)、mount(8) 和/或 blkid(8)。 # # 編輯此檔案後,執行 ‘systemctl daemon-reload’ 來更新 systemd 從該檔案產生的 # 個單位。 # /dev/mapper/rhel-root/xfs 預設 0 0 UUID=6b22cebf-8f1c-405b-8fa8-8f12e1b6b56c /boot xfs 預設 0 0 /dev/mapper/rhel-swap 無 交換預設值 0 0 #為 NFS 共享添加 172.16.200.254:/var/nfs/general /nfs/general nfs4 預設 0 0 現在,您可以使用 mount 命令確認它已安裝: [root@server1-LK ~]# mount -l | grep NFS
/var/lib/nfs/rpc_pipefs 上的 sunrpc 類型 rpc_pipefs (rw,relatime) 172.16.200.254:/var/nfs/general on /nfs/general 類型 nfs4 (rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255, 從上面突出顯示的文字可以看到,現在已經成功安裝了。在所有伺服器上重複此操作,直到確定所有伺服器都已安裝共享,然後再繼續。 步驟 4:檢查您的主機名稱並配置 /etc/default/LifeKeeper 設定:您可以透過在每個節點上執行以下命令來查看 LifeKeeper 所知道的每個伺服器的主機名稱: /opt/LifeKeeper/bin/lcduname 您需要新增到 /etc/default/LifeKeeper 檔案的設定範例: WITNESS_MODE=存儲 QWK_STORAGE_TYPE=文件 QWK_STORAGE_HBEATTIME=6 QWK_STORAGE_NUMHBEATS=9 QWK_STORAGE_OBJECT_server1_LK_localdomain=/nfs/general/nodeA QWK_STORAGE_OBJECT_server2_LK_localdomain=/nfs/general/nodeB 對於“QWK_STORAGE_OBJECT_<server-name>”,您需要為每個節點聲明它,它是使用您的主機名稱、路徑以及見證文件本身的所需位置形成的。 需要注意的是,如果主機名稱包含“-”或“.”,請將其替換為底線“_”(例如 lksios-1 → lksios_1 或 lksios-1.localdomain → lksios_1_localdomain )。 在我的範例中,我有以下主機名稱: server1-LK.localdomain server2-LK.localdomain 這意味著添加以下“QWK_STORAGE_OBJECT_”定義: QWK_STORAGE_OBJECT_server1_LK_localdomain=/nfs/general/nodeA QWK_STORAGE_OBJECT_server2_LK_localdomain=/nfs/general/nodeB 此外,我們需要調整 /etc/default/LifeKeeper 中的現有設定之一: QUORUM_MODE=存儲 為了幫助理解為什麼我們將 WITNESS_MODE 和 QUORUM_MODE 設定為存儲,請查看下表: 支持仲裁模式和見證模式的組合 LifeKeeper 支援以下組合。
我們有一個雙節點集群,想要使用外部存儲來進行仲裁,因此唯一支援的組合是兩個值的「存儲」。但是,您可以從表中看到,當您需要更多節點時,這可以非常靈活,提供多種方式來實現通訊並提供法定人數。 第四步:初始化見證檔:若要初始化見證檔案並啟用其使用,您必須在每個節點上執行以下命令: [root@server1-LK ~]# /opt/LifeKeeper/bin/qwk_storage_init
運行時它將暫停,直到每個節點完成,因此在叢集中的第一個節點上執行命令,然後在第二個節點上執行命令,依此類推,然後返回檢查命令是否完成且沒有錯誤。 例子: [root@server1-LK ~]# /opt/LifeKeeper/bin/qwk_storage_init
好的:LifeKeeper 正在運行。 ok:LifeKeeper 許可證金鑰已成功安裝。 ok:QWK 參數有效。 /nfs/general/nodeA 的 QWK 物件尚不可用。 /nfs/general/nodeA 已存在,但不存在 QWK_STORAGE_OBJECT:覆蓋? (是/否):是 ok:QWK物件的路徑有效。 好的:下:/opt/LifeKeeper/etc/service/qwk-storage:1377s ok:本節點QWK物件初始化完成。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 /nfs/general/nodeB 的 QWK 物件尚不可用。 ok:仲裁系統已準備就緒。 ok: 運行: /opt/LifeKeeper/etc/service/qwk-storage: (pid 14705) 1s, 正常down 成功的。 第 5 步:驗證配置:可以透過執行以下命令來驗證配置: /opt/LifeKeeper/bin/lktest 如果發現任何錯誤,它們將被列印到終端上。在下面的範例中,我沒有替換主機名稱中的特殊字符,因此它突出顯示無法找到儲存。 [root@server1-LK ~]# /opt/LifeKeeper/bin/lktest
/opt/LifeKeeper/bin/lktest: /etc/default/LifeKeeper[308]: QWK_STORAGE_OBJECT_server1_LK.localdomain=/nfs/general/nodeA: 找不到 /opt/LifeKeeper/bin/lktest: /etc/default/LifeKeeper[309]: QWK_STORAGE_OBJECT_server2_LK.localdomain=/nfs/general/nodeB: 找不到 FS UID PID PPID C CLS PRI NI SZ STIME TIME CMD 4 S 根 2348 873 0 TS 39 -20 7656 15:49 00:00:00 lcm 4 S 根 2388 882 0 TS 39 -20 59959 15:49 00:00:00 ttymonlcm 4 S 根 2392 872 0 TS 29 -10 10330 15:49 00:00:00 液晶 4 S 根 8591 8476 0 TS 19 0 7670 15:58 00:00:00 lcdremexec -d server2-LK.localdomain -e — cat /proc/mdstat 您也可以透過命令列確認見證文件正在更新,如下所示: [root@server1-LK ~]# cat /nfs/general/nodeA
簽名=lifekeeper_qwk_object local_node=server1-LK.localdomain 時間=2024年2月15日星期四14:10:56 序列=157 節點=server2-LK.localdomain 通訊狀態=UP 校驗和=13903688106811808601 使用 NFS 的成功文件共享見證 使用 NFS 設定檔共享見證非常簡單!如果您僅限於兩個節點,但需要更好地應對腦裂事件,那麼它可能會很強大,特別是在雲中,您可以利用AWS 的EFS 之類的東西……另一個重要部分可以是利用更多的通訊路徑,但這是一個不同的部落格。但是,透過遵循本指南中概述的步驟,您可以增強叢集應用程式的彈性並最大限度地降低停機風險。請始終參考SIOS文檔以及進一步指導和優化高可用性設定的最佳實踐。它是公開的並且非常全面! SIOS 高可用性和災難復原 SIOS科技公司提供高可用性和災難復原透過針對最重要應用程式的叢集管理來保護和最佳化 IT 基礎架構的產品。今天聯繫我們有關我們的服務和專業支援的更多資訊。 經許可轉載安全作業系統 |
||||||||||||||||||||||||||||
30 3 月, 2024 |
SIOS 產品管理團隊很高興地宣布 SIOS LifeKeeper for Linux v 9.8.1 全面上市。SIOS 產品管理團隊很高興地宣布 SIOS LifeKeeper for Linux v 9.8.1 全面上市。LifeKeeper Linux v 9.8.1 中的新增功能
經許可轉載安全作業系統
|
||||||||||||||||||||||||||||
25 3 月, 2024 |
前 30 天:SIOS LifeKeeper 或 SIOS DataKeeper 新手需要了解的關鍵事項前 30 天:SIOS LifeKeeper 或 SIOS DataKeeper 新手需要了解的關鍵事項作為一名相對較新的員工,我的老闆讓我寫下我對 SIOS 產品的印像以及 SIOS 新手可能想知道的事情。這是我的想法。 主要產品概念:集群和資料鏡像生命守護者(視窗或者Linux)是監控整個應用程式堆疊(網路、儲存、O/S、資料庫、應用程式軟體和伺服器硬體)的叢集軟體。它允許您指定備份實體或虛擬資源(稱為節點)以及連接它們的通訊路徑。可以建立每個節點上的關聯來表示資源層次結構,例如可以在資料庫應用程式和資料庫資料之間建立關聯。當系統遷移時,這種關聯將應用程式和資料保持在一起。 Lifekeeper 也提供查看節點系統日誌的功能。 資料管理員是與 LifeKeeper 捆綁在一起的軟體工具。它提供將本機來源磁碟機即時鏡像到位於客戶網路或雲端中其他位置的目標磁碟機的功能。這提供了對驅動器中斷或故障的恢復能力。驅動器資料鏡像由 SIOS 軟體處理,當來源磁碟機發生變更時,該軟體會自動將資料從來源同步到目標。點陣圖用於將寫入映射到特定區塊,並且區塊級寫入用於執行複製。 Datakeeper 和 Lifekeeper 產品的主要功能和詳細信息這兩種產品均支援 Linux 和 Windows 作業系統。 救生員優惠高 IT 彈性解決問題,保持系統正常運作。如果偵測到問題,系統將嘗試重新啟動應用程式。如果不成功,它將執行故障轉移到備用節點。如果通訊路徑發生故障,則會進行幹預,並根據每個節點可用的資料和預先配置的仲裁設定確定哪個節點成為來源節點。 DataKeeper 可讓您設定來源和目標連接同步或非同步驅動器寫入。同步文件寫入,是指系統在報告寫入完成之前就完成了目的地的寫入;它的反應速度較慢,但更安全。透過非同步檔案寫入,寫入操作在背景執行,提供更快的回應。 Datakeeper 使用 WAN 節流和資料壓縮來提高效率。 產品組合可用於將應用程式遷移到新的虛擬機器或在輔助系統上執行維護,同時保持主系統的運作。 Datakeeper 和 Lifekeeper 產品價值使用 SIOS Datakeeper 的一個主要好處是您可以使用系統上已存在的本機連線磁碟機。無需規劃和購買儲存硬體。無需擔心 RAID 控制器發生故障、阻止存取所有儲存裝置或整個儲存單元成為勒索軟體等攻擊的目標。 Lifekeeper 可作為集群解決方案使用具有資源故障檢測和故障轉移功能的多個節點,或在單節點變體(單一伺服器保護)中提供,為單一伺服器系統提供資源故障檢測和重新引導功能。兩者均可用於 Linux 和 Windows,為各種類型的客戶系統提供保護。 LifeKeeper 不需要任何客製化的容錯硬體。 Linux Lifekeeper 支援 RHEL9-7、SLES15-12、Oracle Linux 9-6、CentOS 8-6 Rocky 8-6、Miracle 9-8,並且可以使用 VMware vSphere、VMware Cloud on AWS、KVM、Oracle VM Server 和Nutanix Acropolis虛擬機器管理程序。 Linux LifeKeeper 安裝設定腳本利用套件管理器工具來安裝產品。 需要了解的要點SIOS LifeKeeper 或 DataKeeper 的新手可能會遇到一些常見的困惑點。以下是一些需要注意的事項: 資料管理員:
救生員:
SIOS 技術文檔閱讀官方SIOS技術文檔了解有關產品詳細資訊以及如何解決問題的更多資訊。從支援頁面,您可以訪問支援門戶。 支援門戶具有以下選項卡: –「解決方案」標籤將帶您進入顯示問題/解決方案組合的頁面。 – 案例標籤將帶您到詳細顯示各種案例的頁面 這兩個頁面都有搜尋面板,讓客戶可以深入尋找相關記錄。 關鍵災難復原術語和術語自動故障轉移– 故障偵測以及主磁碟機和備用磁碟機的切換由 SIOS 軟體處理,從而使客戶的系統在發生中斷時仍能正常運作。 應用程式恢復套件 (ARK)– 可保護您的關鍵業務應用程式和資料免受停機和災難的影響。 ARK 提供執行設定、手動任務自動化和故障轉移的功能。 簇– 一組充當單一系統的實體或虛擬機,提供冗餘以建立高可用性資源。 鏡像– 有意將主磁碟機內容變更即時同步到備用磁碟機。 切換– 使用者發起源驅動器和備用驅動器的切換。當需要對驅動器執行系統維護時使用。 給下一個新手的教訓與技巧:事實證明,對於我記住迄今為止所學的知識最有用的是做大量筆記,並與同伴一起錄製培訓課程的螢幕影片。這為您提供了一些具體的內容以供日後參考。 練習設定鏡子、連接它們並工作,然後執行切換,這對我對產品的理解非常有幫助。練習練習練習。官方文件是了解如何執行操作的絕佳資源。 SIOS 高可用性和災難復原SIOS科技公司提供高可用性和災難復原透過針對最重要應用程式的叢集管理來保護和最佳化 IT 基礎架構的產品。今天聯繫我們有關我們的服務和專業支援的更多資訊。 經許可轉載安全作業系統 |
||||||||||||||||||||||||||||
18 3 月, 2024 |
什麼是許可證重新託管?什麼是許可證重新託管?如何在 SIOS 許可入口網站中執行許可證重新託管當 SIOS 永久產品許可證首次在 SIOS 許可證入口網站中啟動時,它會綁定到該伺服器本地的唯一識別碼。此唯一識別碼通常是指派給網路介面控制器 (NIC) 的 MAC 位址(也稱為系統的 hostid)。當該系統的唯一識別碼從用於啟動許可證的原始唯一識別碼發生變更時,需要重新託管許可證才能繼續使用SIOS產品。 許可證重新託管是當系統的唯一識別碼(MAC 位址/系統的主機 ID)不再與產品許可證密鑰中原始系統的唯一識別碼匹配時啟動更新的產品許可證密鑰所需的過程。 什麼時候需要許可證重新託管?當系統的唯一識別碼與用於建立原始許可證金鑰的原始唯一識別碼發生變更時,需要重新託管。有幾種情況可能會導致唯一識別碼發生變更:
需要許可證重新託管時會出現什麼問題需要許可證重新託管時最常見的問題是 SIOS 產品無法開始正常運作。發生這種情況時,日誌將顯示由於許可證金鑰無效而導致的失敗,因為系統上安裝的許可證金鑰與系統的唯一識別碼不符。 在 Windows 系統上,此錯誤出現在應用程式日誌下的事件檢視器中 在 Linux 系統上,此錯誤出現在位於 /var/log 的 LifeKeeper 日誌中。 重新託管許可證金鑰的過程是什麼流程的第一步是登入 SIOS 許可入口網站。去support.us.sios.com並選擇管理許可證 選擇管理許可證後,登入許可站點: 登入後,前往許可證支援和列出許可證
點擊綠色加號 輸入新的 12 個字元的主機 ID/MAC 位址,然後按一下「確定」。12 個字元之間請勿包含逗號、冒號或空格。
SIOS 高可用性和災難復原SIOS科技公司提供高可用性集群軟體透過叢集管理保護和優化您最重要的應用程式的 IT 基礎架構。今天聯繫我們有關我們的服務和專業支援的更多資訊。 |