Date: เมษายน 26, 2022
วิธีที่ดีที่สุดวิธีเดียวในการปรับใช้องค์ประชุม/พยาน
ระหว่างการประชุมครั้งล่าสุด ลูกค้าถามคำถามเกี่ยวกับความพร้อมใช้งานสูง (HA) และความจำเป็นในองค์ประชุม/ความเป็นไปได้ในการเป็นพยาน คำถามของพวกเขาคือ "วิธีที่ดีที่สุดในการปรับใช้องค์ประชุม/พยานคืออะไร" คำตอบสำหรับคำถามนั้นง่าย ไม่มีวิธีที่ดีที่สุดวิธีเดียวในการปรับใช้โควรัมเพื่อให้เข้าใจถึงสาเหตุ ให้เริ่มต้นด้วยการกำหนดสิ่งสำคัญสามประการ: ทรัพยากรพยานคืออะไร ทรัพยากรองค์ประชุม และสถานการณ์สมองแตก
สมองแตกคืออะไร?
ในสภาพแวดล้อมคลัสเตอร์ปกติ แอปพลิเคชันที่ได้รับการป้องกันกำลังทำงานบนโหนดหลักในคลัสเตอร์ในกรณีที่แอปพลิเคชันของโหนดหลักนั้นล้มเหลว ซอฟต์แวร์การทำคลัสเตอร์จะย้ายการทำงานของแอปพลิเคชันไปยังโหนดรองหรือโหนดระยะไกล ซึ่งจะถือว่ามีบทบาทหลัก ในเวลาใดก็ตาม มีโหนดหลักเพียงโหนดเดียว
Split brain เป็นภาวะที่เกิดขึ้นเมื่อสมาชิกของคลัสเตอร์ไม่สามารถสื่อสารกันได้ แต่อยู่ในสถานะทำงานและทำงานได้ และต่อมาจะเข้าเป็นเจ้าของทรัพยากรร่วมกันพร้อมกัน ผลก็คือ คุณมีคนขับรถบัสสองคนต่อสู้กันเพื่อชิงพวงมาลัยSplit-brain เนื่องจากลักษณะการทำลายล้าง อาจทำให้ข้อมูลสูญหายหรือเสียหายของข้อมูล และควรหลีกเลี่ยงผ่านการใช้ฟันดาบ องค์ประชุม พยาน หรือองค์ประชุม/ฟังก์ชั่นพยานสำหรับการอนุญาโตตุลาการคลัสเตอร์
ในตัวจัดการคลัสเตอร์ส่วนใหญ่ องค์ประชุมจะยังคงอยู่เมื่อ:
- เซิร์ฟเวอร์ทั้งหมดสามารถเห็นสถานะเดียวกันสำหรับคลัสเตอร์เพียร์ทั้งหมดและพยาน
- เซิร์ฟเวอร์ทั้งหมดสามารถเห็นสถานะเดียวกันสำหรับคลัสเตอร์เพียร์ทั้งหมด แม้ว่าจะไม่ใช่พยานก็ตาม
- เซิร์ฟเวอร์ทั้งหมดสามารถเห็นทรัพยากรที่เป็นพยาน แม้ว่าจะไม่เห็นกันและกัน และหลีกเลี่ยงสถานการณ์ที่สมองแตกได้
ในตัวจัดการคลัสเตอร์ส่วนใหญ่ องค์ประชุมจะหายไปเมื่อ:
- เซิร์ฟเวอร์ไม่สามารถดูคลัสเตอร์เพียร์ทั้งหมดและเซิร์ฟเวอร์ที่เป็นพยานได้
- เซิร์ฟเวอร์ไม่สามารถเห็นกลุ่มเพียร์ของคลัสเตอร์ส่วนใหญ่ แม้ว่าจะสามารถเห็นเซิร์ฟเวอร์ที่เป็นพยานได้ก็ตาม
- เซิร์ฟเวอร์ไม่สามารถเข้าถึงหรือรักษาการเข้าถึงทรัพยากรควอรัมเพื่อตัดสินความเป็นสมาชิกควอรัมและการเข้าถึงทรัพยากรได้สำเร็จ
ทรัพยากรพยาน (หรือเซิร์ฟเวอร์) คืออะไร?
ทรัพยากรพยานคือเซิร์ฟเวอร์ ปลายทางของเครือข่าย หรืออุปกรณ์ที่ใช้เพื่อให้บรรลุและรักษาองค์ประชุมเมื่อคลัสเตอร์มีจำนวนสมาชิกเป็นคู่คลัสเตอร์ที่มีสมาชิกเป็นจำนวนคี่ โดยใช้คลัสเตอร์ส่วนใหญ่ ไม่จำเป็นต้องใช้ทรัพยากรพยานในฐานะสมาชิกทั้งหมดของเซิร์ฟเวอร์คลัสเตอร์เพื่อตัดสินการเป็นสมาชิกส่วนใหญ่
องค์ประชุมและทรัพยากรองค์ประชุมคืออะไร?
ทรัพยากรควอรัมคือทรัพยากร (อุปกรณ์ ระบบ ที่เก็บข้อมูลบล็อก ที่จัดเก็บไฟล์ การแชร์ไฟล์ ฯลฯ) ที่ทำหน้าที่เป็นวิธีการตัดสินชี้ขาดของสถานะคลัสเตอร์และการเป็นสมาชิกในตัวจัดการคลัสเตอร์บางตัว ควอรัมเป็นทรัพยากรภายในคลัสเตอร์ที่ช่วยหรือจำเป็นสำหรับสถานะคลัสเตอร์และการตัดสินใจเป็นสมาชิกของคลัสเตอร์ในตัวจัดการคลัสเตอร์อื่นๆ ควอรัมทำหน้าที่เป็นตัวแบ่งส่วนข้อมูลเพื่อหลีกเลี่ยงการแบ่งสมอง
มากกว่าหนึ่งวิธีในการปรับใช้โควรัม
ด้วยลักษณะสำคัญขององค์ประชุม จึงจำเป็นที่สถาปัตยกรรม HA จะปรับใช้ทรัพยากรองค์ประชุม/พยานอย่างเหมาะสม และโชคดี (หรือน่าเสียดาย) ไม่มีโสด วิธีที่ดีที่สุดในการปรับใช้องค์ประชุมมีปัจจัยหลายประการที่อาจกำหนดแนวทางปฏิบัติในการเป็นพยานและแหล่งข้อมูลโควรัมของคุณปัจจัยเหล่านี้รวมถึง:
1. การปรับใช้ของคุณจะอยู่ในองค์กร คลาวด์ หรือไฮบริด
การปรับใช้ในศูนย์ข้อมูลภายในองค์กรซึ่งมีอุปกรณ์จัดเก็บข้อมูลเพิ่มเติม เช่น ที่จัดเก็บไฟเบอร์แชนเนล อุปกรณ์ควบคุมพลังงานหรือการเชื่อมต่อ หรืออุปกรณ์สโตนนิธแบบเดิม จะช่วยให้ลูกค้ามีตัวเลือกเพิ่มเติมสำหรับองค์ประชุมและฟังก์ชันการทำงานที่เป็นพยานที่อาจไม่ได้อยู่ในคลาวด์ในทำนองเดียวกัน สภาพแวดล้อมระบบคลาวด์และไฮบริดนำเสนอความแตกต่างในสิ่งที่สามารถปรับใช้ได้ และกรณีการใช้งานใดที่โควรัมกำลังถูกปรับใช้เพื่อป้องกัน นอกจากนี้ ข้อกำหนดและความแตกต่างของเวลาในการตอบสนองอาจจำกัดประเภทของอุปกรณ์และทรัพยากรที่พร้อมใช้งานสำหรับการกำหนดค่าองค์ประชุม/การยืนยัน
2. วัตถุประสงค์ในการกู้คืนของคุณ
วัตถุประสงค์การกู้คืนก็มีความสำคัญเช่นกันเมื่อต้องพิจารณาเมื่อออกแบบและออกแบบโควรัมของคุณและเป็นพยานแหล่งข้อมูลในตัวอย่างสองโหนดคลัสเตอร์ (โหนด A และโหนด B) เมื่อโหนด A ประสบกับการสูญเสียการเชื่อมต่อกับโหนด B ลำดับความสำคัญสูงสุดสำหรับการกู้คืนคืออะไร หากทรัพยากรพยาน/องค์ประชุมอยู่ในเครือข่ายเดียวกันกับโหนด A ซึ่งอาจส่งผลให้โหนด A ยังคงออนไลน์อยู่ แต่ถูกตัดออกจากไคลเอ็นต์ ในขณะที่โหนด B ไม่สามารถประเมินองค์ประชุมและการเข้าครอบครองได้ในทำนองเดียวกัน หากอุปกรณ์โควรัมอาศัยอยู่เฉพาะในภูมิภาค ศูนย์ข้อมูล หรือเครือข่ายที่มีโหนด B การสูญเสียอาจส่งผลให้เกิดการเฟลโอเวอร์ของทรัพยากรไปยังเครือข่ายหรือศูนย์ที่หมดอายุ หรืออยู่ห่างจากโหนดหลักที่ทำงานและการทำงาน
3. ความซ้ำซ้อนของศูนย์ข้อมูลที่มีอยู่ (หรือภูมิภาค) ภายในโครงสร้างพื้นฐานของคุณ
ความซ้ำซ้อนของศูนย์ข้อมูลหรือภูมิภาคยังเป็นปัจจัยสำคัญในโทโพโลยี HA ของคุณด้วยองค์ประชุม/พยาน หากศูนย์ข้อมูลของคุณมีความซ้ำซ้อนเพียงสองระดับ คุณต้องเข้าใจการแลกเปลี่ยนระหว่างตำแหน่งขององค์ประชุม/พยานในศูนย์ข้อมูลเดียวกันกับโหนดคลัสเตอร์หลักหรือสแตนด์บาย หากศูนย์ข้อมูลมีระดับซ้ำซ้อนมากกว่าสองระดับ เช่น โซนความพร้อมใช้งานที่สามหรือการเข้าถึงภูมิภาคที่สอง ตัวเลือกนี้จะให้ความซ้ำซ้อนในระดับที่สูงขึ้นสำหรับคลัสเตอร์
4. ข้อกำหนดการกู้คืนจากภัยพิบัติ
การทำความเข้าใจข้อกำหนดการกู้คืนจากความเสียหายที่แท้จริงของคุณก็เป็นปัจจัยสำคัญในการออกแบบของคุณเช่นกัน หากซอฟต์แวร์ตัวจัดการคลัสเตอร์ของคุณต้องการการเข้าถึงองค์ประชุม/พยานเพื่อกู้คืนจากการหยุดทำงานของศูนย์ข้อมูลทั้งหมด (หรือความล้มเหลวของภูมิภาค) คุณจะต้องเข้าใจผลกระทบนี้ต่อการออกแบบของคุณแพ็คเกจซอฟต์แวร์ที่มีความพร้อมใช้งานสูงจำนวนมากมีเครื่องมือหรือวิธีการสำหรับสถานการณ์นี้ แต่ถ้าซอฟต์แวร์ของคุณไม่มี การออกแบบและการจัดวางองค์ประชุม/พยานอาจจำเป็นต้องปรับให้เข้ากับความเป็นจริงนี้
5. จำนวนสมาชิกภายในคลัสเตอร์ และที่ตั้งของพวกเขา
โดยทั่วไปไม่จำเป็นต้องใช้เซิร์ฟเวอร์องค์ประชุม/พยานเพิ่มเติมเมื่อคลัสเตอร์มีจำนวนโหนดเป็นเลขคี่อย่างไรก็ตาม หากใช้เพียงสองโหนดในคลัสเตอร์หรือปรับใช้โหนด DR ที่ไม่พร้อมใช้งานตลอดเวลา อาจเปลี่ยนสถาปัตยกรรมของคุณได้ในฐานะรองประธานฝ่ายประสบการณ์ลูกค้า ฉันได้ทำงานกับลูกค้าที่ได้ปรับใช้สถาปัตยกรรมโหนดสามตัว แต่เพื่อการประหยัดต้นทุน พวกเขาจะทำการปิดเซิร์ฟเวอร์ที่สามโดยอัตโนมัติเป็นระยะ
6. ระบบปฏิบัติการและตัวจัดการคลัสเตอร์
ปัจจัยสุดท้ายที่จะกล่าวถึงองค์ประชุม/พยานคือตัวจัดการคลัสเตอร์และระบบปฏิบัติการซอฟต์แวร์ HA และตัวจัดการคลัสเตอร์ไม่ได้ทั้งหมดเท่าเทียมกันเมื่อพูดถึงการปรับใช้องค์ประชุม/พยานหรืออนุญาโตตุลาการของสถานะองค์ประชุมซอฟต์แวร์การทำคลัสเตอร์บางตัวต้องใช้ดิสก์ที่ใช้ร่วมกันเพื่ออนุญาโตตุลาการ ส่วนซอฟต์แวร์อื่นๆ อนุญาตให้แชร์ได้ (NFS, SMB, EFS, Azure Files และ S3)การตระหนักถึงสิ่งที่ตัวจัดการคลัสเตอร์ของคุณต้องการ และโหมดที่สนับสนุนโดยคำนึงถึงองค์ประชุม (ส่วนใหญ่ธรรมดา พยาน แชร์ไฟล์ ฯลฯ) จะมีผลกระทบไม่เฉพาะกับสิ่งที่คุณปรับใช้ แต่ยังส่งผลต่อวิธีที่คุณปรับใช้ด้วย
วิธีที่ดีที่สุดวิธีเดียวในการปรับใช้เซิร์ฟเวอร์องค์ประชุม/คำพยานคือการทำความเข้าใจคำจำกัดความขององค์ประชุม/คำพยานของผู้จำหน่ายของคุณและตัวเลือกที่มีอยู่ ทราบความต้องการของคุณ ปัจจัยในข้อจำกัดหรือโอกาสที่นำเสนอโดยศูนย์ข้อมูลของคุณ (หรือสภาพแวดล้อมระบบคลาวด์) และออกแบบโซลูชัน ที่ให้ระบบที่สำคัญของคุณได้รับการปกป้องในระดับสูงสุดจากการแยกสมอง การเฟลโอเวอร์ที่ผิดพลาด และการหยุดทำงาน
-Cassius Rhue รองประธานฝ่ายประสบการณ์ลูกค้า