Date: เมษายน 3, 2025
เหตุใด Storageless/Nodeless Quorum จึงเป็นอันตรายต่อความพร้อมใช้งานของคลัสเตอร์?
โดยทั่วไปองค์ประชุมหมายถึงองค์กรหรือกลุ่มบุคคลที่จะเข้าร่วมประชุมเพื่อตัดสินใจ
ใน LifeKeeper Quorum จะบังคับใช้ฉันทามติที่ใช้สถานะของโหนดในคลัสเตอร์เพื่อดำเนินการขั้นตอนถัดไปในการจัดการความล้มเหลวของโหนดภายในคลัสเตอร์ LifeKeeperโควตาสามารถดำเนินการได้ 3 โหมดที่เก็บข้อมูล ส่วนใหญ่ และ TCP Remote (TCP Remote มีเฉพาะใน LifeKeeper สำหรับ Linux เท่านั้น)
- Storage Quorum จะใช้อุปกรณ์จัดเก็บข้อมูลที่ใช้ร่วมกันเพื่อติดตามการอัปเดตที่จัดทำโดยระบบอื่นๆ ในคลัสเตอร์ หากระบบไม่จัดเตรียมการอัปเดต Quorum จะทำเครื่องหมายคลัสเตอร์นั้นว่าล้มเหลว
- องค์ประชุมเสียงข้างมากอาศัยโครงสร้างของคลัสเตอร์จำนวนคี่โดยที่โหนดหนึ่งทำหน้าที่เป็นพยานเพื่อพิจารณาว่าโหนดหนึ่งหรือทั้งหมดในคลัสเตอร์ไม่สามารถสื่อสารกันได้หรือไม่
- การเชื่อมต่อระยะไกลของ TCP ผ่านบริการ TCP/IP บนพอร์ตที่ระบุเพื่อตรวจสอบว่าโหนดในคลัสเตอร์สามารถสื่อสารกันได้หรือไม่
ทำความเข้าใจความสำคัญของโควรัมในคลัสเตอร์
จุดประสงค์ของ Quorum คือการรักษาความพร้อมใช้งานของแอปพลิเคชันโดยดำเนินการแก้ไขเพื่อรับมือกับสถานการณ์ที่ไม่ได้วางแผนไว้ โดยทำได้โดยการลดความเสี่ยงของสถานการณ์ที่ต้องใช้สมองแยกส่วน และลดระยะเวลาหยุดทำงานโดยรักษาการสื่อสารระหว่างโหนดทั้งหมดในคลัสเตอร์
ความเสี่ยงของการดำเนินการโดยไม่มีโควรัมในคลัสเตอร์ของคุณ
การใช้คลัสเตอร์ที่กำหนดค่าโดยไม่มีโควรัมอาจมีความเสี่ยง สถานการณ์ต่อไปนี้จะกล่าวถึงผลกระทบของการไม่มีโควรัมและความสำคัญของการนำไปใช้งาน
สถานการณ์ที่ 1: ลดระยะเวลาหยุดทำงาน
การหยุดทำงานโดยไม่ได้ตั้งใจสามารถเกิดขึ้นได้เมื่อระบบหนึ่งระบบหรือมากกว่านั้นไม่สามารถใช้งานได้เนื่องจากการกระทำที่หลีกเลี่ยงไม่ได้ เช่น ระบบหยุดทำงานหรือการสื่อสารเครือข่ายล้มเหลวชั่วคราว
ด้วยโควรัมเหมือนระบบจัดเก็บข้อมูลหรือการกำหนดค่า TCP จากระยะไกล การเข้าถึงอุปกรณ์จัดเก็บข้อมูลและ/หรือพอร์ตสามารถใช้เพื่อติดตามสถานะการสื่อสารในคลัสเตอร์ มาตรการเพิ่มเติมนี้สามารถป้องกันความล้มเหลวที่ไม่จำเป็นซึ่งอาจทำให้เกิดเวลาหยุดทำงานนาน ในกรณีอื่น Quorum จะใช้มาตรการปิดระบบหรือรีบูตเซิร์ฟเวอร์เพื่อคืนสถานะให้กลับมาเป็นปกติและหลีกเลี่ยงการหยุดทำงานนานเกินไป
สถานการณ์ที่ 2: สมองแยกส่วน
เอสมองแยกส่วนคือเมื่อระบบหลายระบบในคลัสเตอร์เชื่อว่าตนเองเป็นเซิร์ฟเวอร์หลัก ซึ่งอาจเกิดขึ้นได้เมื่อเซิร์ฟเวอร์หลักสูญเสียการสื่อสารกับเซิร์ฟเวอร์รอง และเซิร์ฟเวอร์รองเชื่อว่าระบบหลักหยุดทำงาน ส่งผลให้ระบบหลักสองระบบในคลัสเตอร์ทำงานอยู่
หากมีการกำหนดค่าองค์ประชุมเสียงข้างมาก ระบบอื่นจะได้รับการจัดเตรียมให้เป็นพยานในการลงคะแนนว่าระบบใดควรทำหน้าที่เป็นระบบหลัก เพื่อป้องกันไม่ให้เกิดการแยกเสียงออกจากกัน
เหตุใดการกำหนดค่าโควรัมที่เหมาะสมจึงมีความสำคัญ
การดำเนินการคลัสเตอร์การไม่มีพื้นที่จัดเก็บหรือโควรัมส่วนใหญ่ถือเป็นอันตราย เนื่องจากจะเพิ่มความเสี่ยงในการสูญเสียข้อมูลหรือระยะเวลาหยุดทำงานที่ยาวนานอันเป็นผลจากการใช้สมองแยกส่วนและ/หรือเครือข่ายหยุดทำงาน การใช้ Quroum สามารถให้มาตรการป้องกันได้โดยการทำให้แน่ใจว่าคลัสเตอร์อยู่ในสภาพดีเสมอและระบบที่อยู่ในสภาพไม่ดีจะได้รับการจัดการอย่างเหมาะสม
ติดต่อ SIOS วันนี้เพื่อเรียนรู้ว่าโซลูชันความพร้อมใช้งานสูงของเราจะช่วยคุณกำหนดค่าโควรัมได้อย่างถูกต้องและปกป้องคลัสเตอร์ของคุณได้อย่างไร
ผู้เขียน: Alexus Gore วิศวกรซอฟต์แวร์ประสบการณ์ลูกค้าที่ SIOS Technology Corp.
พิมพ์ซ้ำโดยได้รับอนุญาตจากSIOS