มิถุนายน 23, 2022 |
“Split Brain” คืออะไรและจะหลีกเลี่ยงได้อย่างไร“Split Brain” คืออะไรและจะหลีกเลี่ยงได้อย่างไรตามที่เราได้พูดคุยกันใน ความพร้อมใช้งานสูง สภาพแวดล้อมคลัสเตอร์ มีโหนดที่ใช้งานอยู่หนึ่งโหนดและโหนดสแตนด์บายอย่างน้อยหนึ่งโหนดที่จะเข้ารับบริการเมื่อโหนดที่ใช้งานอยู่ล้มเหลวหรือหยุดตอบสนอง ฟังดูเหมือนเป็นข้อสันนิษฐานที่สมเหตุสมผลจนกว่าจะพิจารณาชั้นเครือข่ายระหว่างโหนด จะเกิดอะไรขึ้นหากเส้นทางเครือข่ายระหว่างโหนดหยุดทำงาน ขณะนี้โหนดทั้งสองไม่สามารถสื่อสารกับโหนดอื่นได้ และในสถานการณ์นี้ เซิร์ฟเวอร์สำรองอาจเลื่อนระดับตัวเองให้เป็นเซิร์ฟเวอร์ที่ใช้งานอยู่บนพื้นฐานที่เชื่อว่าโหนดที่ใช้งานอยู่ล้มเหลว ส่งผลให้ทั้งสองโหนดกลายเป็น 'ใช้งาน' เนื่องจากแต่ละโหนดจะเห็นว่าโหนดอื่นตาย ด้วยเหตุนี้ ความสมบูรณ์ของข้อมูลและความสอดคล้องกันจึงถูกบุกรุก เนื่องจากข้อมูลบนโหนดทั้งสองจะมีการเปลี่ยนแปลง นี้เรียกว่า “แยกสมอง” . เพื่อหลีกเลี่ยงสถานการณ์สมองแตก ควรติดตั้งโหนด Quorum (เรียกอีกอย่างว่า 'พยาน') ภายในคลัสเตอร์ การเพิ่มโหนดควอรัม (ไปยังคลัสเตอร์ที่ประกอบด้วยโหนดจำนวนคู่) จะสร้างโหนดจำนวนคี่ (3, 5, 7 ฯลฯ ) โดยโหนดลงคะแนนเพื่อตัดสินใจว่าควรทำหน้าที่เป็นโหนดที่ใช้งานอยู่ภายในคลัสเตอร์ ในตัวอย่างด้านล่าง ชั้นวางเซิร์ฟเวอร์ที่มีโหนด B หายไป LAN การเชื่อมต่อ ในสถานการณ์สมมตินี้ โดยการเพิ่มโหนดที่ 3 เข้ากับสภาพแวดล้อมคลัสเตอร์ ระบบยังสามารถระบุได้ว่าโหนดใดควรเป็นโหนดที่ทำงานอยู่ ฟังก์ชัน Quorum/Witness รวมอยู่ใน SIOS ชุดป้องกัน เมื่อทำการติดตั้ง Quorum / Witness จะถูกเลือกบนโหนดทั้งหมด (ไม่ใช่เฉพาะโหนดควอรัม) และกำหนดเส้นทางการสื่อสารระหว่างโหนดทั้งหมด (รวมถึงโหนดควอรัมด้วย) โหนดควอรัมไม่ได้โฮสต์บริการใดๆ ที่ใช้งานอยู่ บทบาทเดียวของมันคือการมีส่วนร่วมในการสื่อสารโหนดเพื่อตรวจสอบว่ามีการใช้งานใดอยู่และเพื่อให้ 'การลงคะแนนแบบผูกขาด' ในกรณีที่การสื่อสารหยุดชะงัก SIOS ยังรองรับ IO การฟันดาบและการจัดเก็บ เป็นอุปกรณ์ควอรัม และในการตั้งค่าคอนฟิกเหล่านี้ โหนดควอรัมเพิ่มเติมไม่จำเป็น ทำซ้ำโดยได้รับอนุญาตจาก SIOS
|
มิถุนายน 19, 2022 |
การจำลองข้อมูลระหว่างโหนดทำงานอย่างไรการจำลองข้อมูลระหว่างโหนดทำงานอย่างไรในสถานการณ์จำลองดาต้าเซ็นเตอร์แบบดั้งเดิม ข้อมูลมักจะถูกจัดเก็บบนเครือข่ายพื้นที่จัดเก็บข้อมูล ( ซาน ). สภาพแวดล้อมระบบคลาวด์โดยทั่วไปไม่สนับสนุนการจัดเก็บข้อมูลที่ใช้ร่วมกัน SIOS DataKeeper นำเสนอที่เก็บข้อมูล 'ที่ใช้ร่วมกัน' โดยใช้เทคโนโลยีการจำลองแบบเพื่อสร้างสำเนาของข้อมูลที่ใช้งานอยู่ในปัจจุบัน มันสร้างอุปกรณ์ NetRAID ที่ทำงานเป็นอุปกรณ์ RAID1 (ข้อมูลสะท้อนข้ามอุปกรณ์) การเปลี่ยนแปลงข้อมูลถูกจำลองจากแหล่งมิเรอร์ (อุปกรณ์ดิสก์บนโหนดที่ใช้งาน – โหนด A ในไดอะแกรมด้านล่าง) ไปยังเป้าหมายมิเรอร์ (อุปกรณ์ดิสก์บนโหนดสแตนด์บาย – โหนด B ในไดอะแกรมด้านล่าง) เพื่อรับประกันความสอดคล้องของข้อมูลในอุปกรณ์ทั้งสอง เฉพาะโหนดที่ทำงานอยู่เท่านั้นที่มีสิทธิ์เขียนข้อมูลไปยังอุปกรณ์ที่จำลองแบบ (/จุดเชื่อมต่อ datakeeper ในตัวอย่างด้านล่าง) ไม่อนุญาตให้เข้าถึงอุปกรณ์ที่จำลองแบบแล้ว (จุดเชื่อมต่อ /datakeeper) ในขณะที่เป็นอุปกรณ์เป้าหมายมิเรอร์ (เช่น บนโหนดสแตนด์บาย) ทำซ้ำโดยได้รับอนุญาตจาก SIOS |
มิถุนายน 15, 2022 |
วิธีที่ไคลเอ็นต์เชื่อมต่อกับ Active Nodeวิธีที่ไคลเอ็นต์เชื่อมต่อกับ Active Nodeตามที่กล่าวไว้ก่อนหน้านี้ เมื่อ a คลัสเตอร์ความพร้อมใช้งานสูง ได้รับการกำหนดค่าแล้ว สองโหนดขึ้นไปทำงานพร้อมกันและผู้ใช้เชื่อมต่อกับ โหนด "ใช้งานอยู่" . เมื่อเกิดปัญหากับโหนดที่ใช้งานอยู่ จะเกิดสภาวะ "เฟลโอเวอร์" และโหนด "สแตนด์บาย" จะกลายเป็นโหนด "แอ็คทีฟ" ใหม่ เมื่อเกิดข้อผิดพลาดขึ้น จะต้องมีกลไกที่ยอมให้ไคลเอ็นต์ตรวจหาเงื่อนไขเฟลโอเวอร์และเชื่อมต่อใหม่ หรือโอนเซสชันไคลเอ็นต์ที่ใช้งานอยู่ของผู้ใช้ไปยังโหนดที่ใช้งานอยู่ได้อย่างราบรื่น ที่อยู่ IP เสมือนโดยปกติที่อยู่ IP "เสมือน" จะถูกสร้างขึ้นเมื่อมีการกำหนดค่าคลัสเตอร์และไคลเอ็นต์สื่อสารกับ โหนดที่ใช้งาน โดยใช้ที่อยู่ IP เสมือน เมื่อเกิดข้อผิดพลาดขึ้น ที่อยู่ IP เสมือนจะถูกกำหนดใหม่ให้กับโหนดที่ใช้งานอยู่ใหม่และไคลเอ็นต์จะเชื่อมต่อกับที่อยู่ IP เสมือนเดียวกันอีกครั้ง ตัวอย่างเช่น สมมติว่ามีสองโหนดคือ A และ B โดยมีที่อยู่ IP ของ 10.20.1.10 และ 10.20.2.10 . ในตัวอย่างนี้ เราจะกำหนดที่อยู่ IP เสมือนเป็น 10.20.0.10 ซึ่งควรพิจารณาให้กำหนดให้กับโหนดที่ใช้งานอยู่ในปัจจุบัน ซึ่งคล้ายกับการกำหนดที่อยู่ IP ที่สองให้กับการ์ดอินเทอร์เฟซเครือข่ายหนึ่งใบบนโหนดเดียว ถ้าคำสั่ง ip a ถูกป้อนบนโหนดที่ใช้งานอยู่ ที่อยู่ IP ทั้งสองจะปรากฏขึ้น (ดังในบรรทัดที่ 10 และ 12 ในตัวอย่าง Linux นี้): ดิ ARP มาตรการเมื่อไคลเอนต์พยายามค้นหาเซิร์ฟเวอร์โดยใช้ที่อยู่ IP ไคลเอนต์มักจะใช้ ARP (Address Resolution Protocol) เพื่อค้นหา MAC (Media Access Control) ที่อยู่ของเครื่องเป้าหมาย เมื่อไคลเอนต์กระจายข้อความเพื่อค้นหาที่อยู่ IP เป้าหมาย โหนดที่ทำงานอยู่จะตอบกลับด้วย MAC ที่อยู่และลูกค้าแก้ไขคำขอและเชื่อมต่อกับมัน ARP ทางเลือกอื่นสำหรับสภาพแวดล้อมคลาวด์อย่างไรก็ตาม ในสภาพแวดล้อมคลาวด์ เป็นไปไม่ได้ที่จะระบุโหนดที่ใช้งานอยู่โดยใช้ ARP เนื่องจากหลายเลเยอร์ถูกแยกออกมาในสภาพแวดล้อมเสมือน อาจจำเป็นต้องใช้วิธีการอื่นตามโครงสร้างพื้นฐานของเครือข่ายที่ใช้งานในสภาพแวดล้อมคลาวด์เฉพาะ โดยปกติมีหลายตัวเลือก และควรทำการเลือกจากรายการต่อไปนี้ ทำซ้ำโดยได้รับอนุญาตจาก SIOS
|
มิถุนายน 11, 2022 |
แพลตฟอร์มคลาวด์สาธารณะและความแตกต่างของโครงสร้างเครือข่ายแพลตฟอร์มคลาวด์สาธารณะและความแตกต่างของโครงสร้างเครือข่ายมีหลายอย่าง แพลตฟอร์มคลาวด์สาธารณะ รวมถึง Amazon Web Services ( AWS ), Microsoft Azure และ Google Cloud แม้ว่าโครงสร้างพื้นฐานจะมีความคล้ายคลึงกันหลายประการ แต่ก็มีความแตกต่างบางประการ ในหลายกรณี a VPC (Virtual Private Cloud) หรือ a VNET (Virtual Network) ที่เชื่อมโยงกับภูมิภาคจะถูกสร้างขึ้น หนึ่งหรือมากกว่า VPC s อาจถูกกำหนดไว้สำหรับกลุ่มแอปพลิเคชันแบบลอจิคัล โดยการทำเช่นนี้ ระบบต่างๆ จะถูกแบ่งออกเป็นเครือข่ายที่ไม่เชื่อมต่อกัน เว้นแต่จะแตกต่างกัน VPC มีการเชื่อมต่อกันโดยเฉพาะ ภายใต้ VPC สามารถกำหนดซับเน็ตต่างๆ ได้มากมาย ตามวัตถุประสงค์ เครือข่ายย่อยบางส่วนได้รับการกำหนดค่าเป็นเครือข่ายย่อย "สาธารณะ" ซึ่งสามารถเข้าถึงได้ทางอินเทอร์เน็ต และบางส่วนได้รับการกำหนดค่าเป็นเครือข่ายย่อย "ส่วนตัว" ซึ่งไม่สามารถเข้าถึงอินเทอร์เน็ตได้ ผู้ให้บริการระบบคลาวด์บางราย (เช่น Azure และ Google Cloud) อนุญาตให้กำหนดซับเน็ตใน Availability Zone (ศูนย์ข้อมูลที่แตกต่างกัน) ในขณะที่บางเครือข่าย (เช่น AWS ) ไม่อนุญาตให้กำหนดซับเน็ตใน Availability Zone ในกรณีหลัง จะต้องกำหนดซับเน็ตสำหรับ Availability Zone แต่ละโซน ![]() ในคู่มือนี้ เราจะใช้ Availability Zone ที่แตกต่างกันสำหรับแต่ละโหนด เมื่อฟังก์ชันพื้นฐานของ SIOS เข้าใจผลิตภัณฑ์แล้ว อาจเป็นการเหมาะสมที่จะสำรวจสถานการณ์ต่างๆ (คล้ายกับที่ใช้ในโครงสร้างพื้นฐานเครือข่ายของคุณเอง) ที่เกี่ยวข้องกับการกระจายปริมาณงานผ่านเครือข่ายย่อยต่างๆ การปรับเปลี่ยนช่วง IP สำหรับเครือข่ายย่อยเหล่านี้ การเปลี่ยนลักษณะการเชื่อมต่อเครือข่าย อินเทอร์เน็ต เป็นต้น ทำซ้ำโดยได้รับอนุญาตจาก SIOS
|
มิถุนายน 7, 2022 |
วิธีการกระจายปริมาณงานเมื่อย้ายไปยังสภาพแวดล้อมระบบคลาวด์วิธีการกระจายปริมาณงานเมื่อย้ายไปยังสภาพแวดล้อมระบบคลาวด์การพิจารณาว่าควรแจกจ่ายเวิร์กโหลด (โหนด) อย่างไรเป็นหัวข้อสนทนาทั่วไปเมื่อย้ายไปยังคลาวด์สาธารณะโดยคำนึงถึงความพร้อมใช้งานสูง หากปริมาณงานอยู่ภายในสภาพแวดล้อมภายในองค์กร ตำแหน่งของปริมาณงานเหล่านี้มักถูกกำหนดโดยตำแหน่งของศูนย์ข้อมูลที่จัดตั้งขึ้นบ่อยครั้ง ในหลายกรณี การเลือกสถานที่อื่นเพื่อโฮสต์ปริมาณงานนั้นไม่ใช่ตัวเลือกที่มี ข้อเสนอคลาวด์สาธารณะมีภูมิภาคทางภูมิศาสตร์ที่หลากหลายรวมถึงโซนความพร้อมใช้งานให้เลือก โดยทั่วไป Availability Zone จะคล้ายกับศูนย์ข้อมูล (ตำแหน่งทางกายภาพ) อย่างน้อยหนึ่งแห่งซึ่งตั้งอยู่ในภูมิภาคทางกายภาพเดียวกัน (เช่น ในแคลิฟอร์เนีย) ศูนย์ข้อมูลเหล่านี้อาจตั้งอยู่ในพื้นที่ต่างๆ แต่เชื่อมต่อโดยใช้เครือข่ายความเร็วสูงเพื่อลดเวลาแฝงในการเชื่อมต่อระหว่างกัน (โปรดทราบว่าบริการโฮสติ้งในศูนย์ข้อมูลหลายแห่งภายในขอบเขตความพร้อมใช้งานควรมีความโปร่งใสต่อผู้ใช้) ตามกฎทั่วไป ยิ่งระยะห่างทางกายภาพระหว่างปริมาณงานมากเท่าใด สภาพแวดล้อมก็จะยิ่งมีความยืดหยุ่นมากขึ้นเท่านั้น เป็นสมมติฐานที่สมเหตุสมผลว่าภัยธรรมชาติ เช่น แผ่นดินไหว จะไม่ส่งผลกระทบต่อภูมิภาคต่างๆ ในเวลาเดียวกัน (เช่น ทั้งชายฝั่งตะวันตกของสหรัฐฯ และชายฝั่งตะวันออกในเวลาเดียวกัน) อย่างไรก็ตาม ยังคงมีโอกาสประสบกับความขัดข้องของบริการในภูมิภาคต่างๆ พร้อมกัน เนื่องจากความล้มเหลวทั่วทั้งระบบ (ผู้ให้บริการคลาวด์บางรายเคยรายงานการหยุดทำงานข้ามภูมิภาคพร้อมกัน เช่น ในสหรัฐอเมริกาและออสเตรเลีย) ควรพิจารณาสร้างแผน DR (การกู้คืนจากภัยพิบัติ) ที่กำหนดไว้สำหรับผู้ให้บริการระบบคลาวด์ต่างๆ มุมมองที่ควรค่าแก่การพิจารณาอีกประการหนึ่งคือต้นทุนในการปกป้องทรัพยากร โดยทั่วไป ยิ่งระยะห่างระหว่างปริมาณงานสูงขึ้น ค่าใช้จ่ายในการถ่ายโอนข้อมูลก็จะยิ่งมากขึ้น ในหลายกรณี การถ่ายโอนข้อมูลระหว่างโหนดภายในศูนย์ข้อมูลเดียวกัน (Availability Zone) นั้นฟรี ในขณะที่การถ่ายโอนข้อมูลข้าม Availability Zone อาจมีค่าใช้จ่าย $0.01/GB ขึ้นไป ค่าใช้จ่ายเพิ่มเติมนี้อาจเพิ่มขึ้นเป็นสองเท่า (หรือมากกว่า) เมื่อข้อมูลถูกถ่ายโอนข้ามภูมิภาค (เช่น $0.02 / GB) นอกจากนี้ เนื่องจากระยะห่างทางกายภาพที่เพิ่มขึ้นระหว่างปริมาณงาน จึงควรคาดการณ์เวลาแฝงของข้อมูลระหว่างโหนดระหว่างสถานที่มากขึ้น โดยการพิจารณาปัจจัยเหล่านี้ โดยทั่วไปแล้ว ขอแนะนำให้แจกจ่ายปริมาณงานข้าม Availability Zone ภายในภูมิภาคเดียวกัน ทำซ้ำโดยได้รับอนุญาตจาก SIOS
|