Date: ธันวาคม 3, 2021
วิธีบรรลุความพร้อมใช้งานสูงด้วยคลัสเตอร์
วิธีบรรลุความพร้อมใช้งานสูงด้วยคลัสเตอร์
ความพร้อมใช้งานสูงคืออะไร?
ความพร้อมใช้งานสูง (HA) เป็นส่วนประกอบของระบบเทคโนโลยีที่ขจัดจุดบกพร่องเพียงจุดเดียวเพื่อให้แน่ใจว่ามีการทำงานอย่างต่อเนื่องหรือเวลาทำงานต่อเนื่องเป็นระยะเวลานาน ความพร้อมใช้งานสูง กลุ่ม คือกลุ่มของเซิร์ฟเวอร์ที่รองรับแอปพลิเคชันที่มีความสำคัญต่อธุรกิจซึ่งต้องการการหยุดทำงานน้อยที่สุดและความพร้อมใช้งานอย่างต่อเนื่อง
ทุกองค์กรใช้ฐานข้อมูลและแอปพลิเคชันที่มีความสำคัญต่อธุรกิจที่หลากหลาย เช่น คลังข้อมูล แอปพลิเคชันอีคอมเมิร์ซ ระบบการจัดการลูกค้าสัมพันธ์ (CRM) ระบบการเงิน การจัดการห่วงโซ่อุปทาน และระบบข่าวกรองธุรกิจ เมื่อระบบ ฐานข้อมูล หรือแอปพลิเคชันล้มเหลว องค์กรเหล่านี้ต้องการการป้องกันความพร้อมใช้งานสูงเพื่อให้ระบบทำงานและทำงานต่อไป และลดความเสี่ยงของการสูญเสียรายได้ พนักงานที่ไม่มีประสิทธิภาพ และลูกค้าที่ไม่พึงพอใจ
คลัสเตอร์ที่มีความพร้อมใช้งานสูงประกอบด้วยหลักการออกแบบห้าประการ:
- พวกเขาจะล้มเหลวโดยอัตโนมัติไปยังระบบที่ซ้ำซ้อนเพื่อรับการดำเนินการเมื่อส่วนประกอบที่ใช้งานอยู่ล้มเหลว สิ่งนี้จะกำจัดจุดล้มเหลวเพียงจุดเดียว
- พวกเขาสามารถตรวจจับความล้มเหลวระดับแอปพลิเคชันโดยอัตโนมัติเมื่อเกิดขึ้น โดยไม่คำนึงถึงสาเหตุ
- ทำให้มั่นใจได้ว่าข้อมูลจะไม่สูญหายระหว่างที่ระบบล้มเหลว
- โดยจะเฟลโอเวอร์ไปยังส่วนประกอบที่ซ้ำซ้อนโดยอัตโนมัติและรวดเร็วเพื่อลดเวลาหยุดทำงาน
- พวกเขาให้ความสามารถในการเฟลโอเวอร์ด้วยตนเองและย้อนกลับเพื่อลดเวลาหยุดทำงานระหว่างการบำรุงรักษาที่วางแผนไว้
TechTarget ให้คำจำกัดความ HA ว่าเป็น "ระบบหรือส่วนประกอบที่ทำงานอย่างต่อเนื่องเป็นระยะเวลานานเป็นที่น่าพอใจ ความพร้อมใช้งานสามารถวัดได้เมื่อเทียบกับ 'ใช้งานได้ 100%' หรือ 'ไม่เคยล้มเหลว' มาตรฐานความพร้อมใช้ของระบบหรือผลิตภัณฑ์ซึ่งมีอยู่อย่างกว้างขวางแต่ทำได้ยาก เรียกว่าความพร้อมใช้งาน 'five 9s' (99.999%)” แต่ให้นิยามความพร้อมใช้งานสูงโดยง่าย:
ความพร้อมใช้งานสูงช่วยให้มั่นใจว่าระบบ ฐานข้อมูล และแอปพลิเคชันของคุณทำงานเมื่อจำเป็นและตามความจำเป็น
"เมื่อ" คำนึงถึงเปอร์เซ็นต์ของเวลาที่แอปพลิเคชันต้องเปิดใช้งาน “ตามความจำเป็น” จะพิจารณาถึงการทำงานที่เหมาะสมของระบบ ฐานข้อมูล และ/หรือแอปพลิเคชันโดยไม่สูญเสียข้อมูล
ความพร้อมใช้งานสูงจะแตกต่างกันขึ้นอยู่กับระบบและ/หรือแอปพลิเคชัน ตัวอย่างเช่น ด้วยแอปพลิเคชันที่มีความสำคัญต่อภารกิจ เช่น ระบบอีคอมเมิร์ซของคุณ ความพร้อมใช้งาน 9 วินาที (99.99%) สี่รายการถือเป็นมาตรฐานอุตสาหกรรม ด้วยความพร้อมใช้งาน 99.99% คุณสามารถคาดหวังเวลาหยุดทำงานไม่เกิน 52.60 นาทีต่อปี หรือ 8.64 วินาทีของการหยุดทำงานต่อวัน อย่างไรก็ตาม สำหรับแอปพลิเคชันและระบบที่ไม่สำคัญ เช่น ความล้มเหลวของเดสก์ท็อปเครื่องเดียว ความพร้อมใช้งานสูงอาจเป็น 9 วินาที (99%) สองรายการ ซึ่งเท่ากับเวลาหยุดทำงาน 8.77 ชั่วโมงต่อปี หรือ 1.44 นาทีของการหยุดทำงานต่อวัน เมื่อวัดเวลาหยุดทำงานที่ยอมรับได้ สิ่งสำคัญคือคุณต้องพิจารณา:
- เวลาหยุดทำงานโดยไม่ได้วางแผนไว้ (เช่น ความล้มเหลวของฮาร์ดแวร์หรือซอฟต์แวร์)
- เวลาหยุดทำงานที่วางแผนไว้ซึ่งจำเป็นสำหรับการบำรุงรักษาฮาร์ดแวร์และซอฟต์แวร์เป็นประจำ
- เวลาทำงานที่ระดับฐานข้อมูลและแอปพลิเคชัน
ทางเลือกของคุณสำหรับความพร้อมใช้งานสูงนั้นขึ้นอยู่กับหลายปัจจัย รวมถึงความสำคัญของแอปพลิเคชันต่อธุรกิจ ไม่ว่าลูกค้าจะได้รับผลกระทบ ความถี่ที่แอปพลิเคชันทำงาน จำนวนผู้ใช้ที่ได้รับผลกระทบ ฐานข้อมูลหรือแอปพลิเคชันต้องเปลี่ยนระบบที่ซ้ำซ้อนได้เร็วเพียงใด และข้อมูลสูญหายได้มากน้อยเพียงใด
ตัวชี้วัดความพร้อมใช้งานสูง: RTO และ RPO
ตัววัดสองตัวที่ปกติใช้ในการประเมิน HA (และ Disaster Recovery (DR) เช่นกัน) คือ Recovery Time Objective (RTO) และ Recovery Point Objective (RPO)
- RTO คือระยะเวลาสูงสุดที่ยอมรับได้ของการหยุดทำงานใดๆ โดยทั่วไป แอปพลิเคชันประมวลผลธุรกรรมออนไลน์จะมี RTO ต่ำที่สุด และแอปพลิเคชันที่มีความสำคัญต่อภารกิจมักมี RTO เพียงไม่กี่วินาที
- RPO คือจำนวนสูงสุดของการสูญเสียข้อมูลที่สามารถยอมรับได้เมื่อเกิดความล้มเหลวขึ้น สำหรับ HA RPO มักจะเป็นศูนย์เพื่อระบุว่าควรมีข้อมูลสูญหายเป็นศูนย์ภายใต้สถานการณ์ความล้มเหลวทั้งหมด
อย่างไรก็ตาม มีความแตกต่างระหว่างสิ่งที่ RTO และ RPO ที่คุณสามารถทำได้เพื่อรองรับความพร้อมใช้งานสูงเมื่อเทียบกับ การกู้คืนระบบ . ด้วย HA การจำลองข้อมูล สามารถซิงโครนัสได้เนื่องจากส่วนประกอบที่ซ้ำซ้อนของคุณอยู่ในสภาพแวดล้อม LAN ของคุณ ฐานข้อมูลแบบแอ็คทีฟและสแตนด์บายสามารถอัปเดตพร้อมกันได้ ทำให้สามารถกู้คืนข้อมูลแบบเรียลไทม์เต็มรูปแบบโดยอัตโนมัติ ซึ่งสามารถตอบสนอง RTO และ RPO ที่มีความต้องการสูงสุดได้ เป็นผลให้อินสแตนซ์สแตนด์บายของคุณ "ร้อน" และซิงค์กับอินสแตนซ์ที่ใช้งานอยู่ของคุณ ดังนั้นจึงพร้อมที่จะเข้าควบคุมทันทีในกรณีที่เกิดความล้มเหลว
อย่างไรก็ตาม ในการกู้คืนระบบ ซอฟต์แวร์ และข้อมูลในกรณีที่เกิดภัยพิบัติ จำเป็นต้องมีส่วนประกอบที่ซ้ำซ้อนบนเครือข่ายบริเวณกว้าง (WAN) นี่เป็นสิ่งสำคัญเนื่องจากคุณต้องเก็บส่วนประกอบที่ซ้ำซ้อนในตำแหน่งทางภูมิศาสตร์ให้ห่างจากอินสแตนซ์ที่ใช้งานอยู่ แต่ด้วย WAN การจำลองข้อมูลจะไม่พร้อมกันเพื่อหลีกเลี่ยงการส่งผลเสียต่อประสิทธิภาพการรับส่งข้อมูล ซึ่งหมายความว่าการอัปเดตอินสแตนซ์สแตนด์บายจะทำให้การอัปเดตที่ทำกับอินสแตนซ์ที่ใช้งานอยู่ล่าช้า ส่งผลให้เกิดความล่าช้าในระหว่างกระบวนการกู้คืน เนื่องจากภัยพิบัติเกิดขึ้นได้ยาก ความล่าช้าบางอย่างจึงอาจพอทนได้และขึ้นอยู่กับ (ก) ความสำคัญของธุรกิจของคุณในการบรรลุ RTO และ RPO ที่ต่ำที่สุดเท่าที่จะเป็นไปได้ และ (b) งบประมาณที่คุณสามารถจัดสรรเพื่อให้ได้ RTO และ RPO ที่ดีที่สุด
SIOS ช่วยให้คุณบรรลุความพร้อมใช้งานสูงได้อย่างไร
SIOS นำเสนอโซลูชันเดียวที่ตอบสนองทั้งความต้องการความพร้อมใช้งานสูงและการกู้คืนจากความเสียหายในระบบปฏิบัติการ สภาพแวดล้อมโครงสร้างพื้นฐาน และแอปพลิเคชันที่หลากหลาย รวมถึง SAP, SQL Server, Oracle และสภาพแวดล้อมอื่นๆ ที่ทำงานในการกำหนดค่าพื้นที่เก็บข้อมูลที่ใช้ร่วมกันบน SAN หรือ SANless , การกำหนดค่าการจัดเก็บข้อมูลในเครื่อง
- สภาพแวดล้อมของ Windows : เมื่อเพิ่มในสภาพแวดล้อม Windows Server Failover Cluster (WSFC) แล้ว SIOS DataKeeper จะช่วยให้คุณสร้างคลัสเตอร์ SANless โดยที่คลัสเตอร์การจัดเก็บข้อมูลที่ใช้ร่วมกันเป็นไปไม่ได้หรือทำไม่ได้ หรือเพิ่มการจำลองแบบสำหรับการป้องกันภัยพิบัติในคลัสเตอร์ Windows ที่ใช้ SAN ของคุณ การจำลองแบบอิงโฮสต์ที่รวดเร็วและมีประสิทธิภาพจะซิงโครไนซ์ที่เก็บข้อมูลในเครื่องบนโหนดคลัสเตอร์ในเครื่องและโหนดระยะไกล สร้างคลัสเตอร์ SANLess ในสภาพแวดล้อมทางกายภาพ เสมือน หรือคลาวด์
- สภาพแวดล้อม Linux : SIOS Protection Suite สำหรับ Linux เป็นแพ็คเกจ ซอฟต์แวร์จัดกลุ่ม โซลูชันที่ใช้ SIOS LifeKeeper และ SIOS DataKeeper เพื่อให้มีการรวมคลัสเตอร์ล้มเหลวที่มีความพร้อมใช้งานสูง การตรวจสอบแอปพลิเคชันอย่างต่อเนื่อง การจำลองข้อมูล และนโยบายการกู้คืนที่กำหนดค่าได้ เพื่อปกป้องแอปพลิเคชันและข้อมูลที่สำคัญต่อธุรกิจของคุณจากการหยุดทำงานและภัยพิบัติ SIOS Protection Suite ให้คุณสร้างคลัสเตอร์ SAN หรือ SANLess โดยใช้อุปกรณ์จัดเก็บข้อมูลที่หลากหลาย รวมถึงที่เก็บข้อมูลที่ต่อโดยตรง, iSCSI และ Fibre Channel SIOS Protection Suite สำหรับ Linux รองรับลีนุกซ์รุ่นหลักๆ ทั้งหมด รวมถึง Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS และ Oracle Linux
ด้วยโซลูชัน SIOS RPO จะเป็นศูนย์เสมอ และ RTO จะขึ้นอยู่กับแอปพลิเคชัน แต่โดยทั่วไปแล้ว 30 วินาทีถึงไม่กี่นาทีสำหรับบางแอปพลิเคชัน มาพูดคุยกันเกี่ยวกับกรณีศึกษา “SIOS ที่ใช้งานได้จริง” ของลูกค้ารายหนึ่งโดยใช้คลัสเตอร์ HA ที่บริษัทค้าปลีกที่ใหญ่ที่สุดของสวิตเซอร์แลนด์
Migros บรรลุความต่อเนื่องทางธุรกิจที่สำคัญของระบบ POS ด้วย SIOS High Availability Solutions
Migros เป็นบริษัทค้าปลีกรายใหญ่ที่สุดของสวิตเซอร์แลนด์ มีเครือข่ายซูเปอร์มาร์เก็ตที่ใหญ่ที่สุด และเป็นนายจ้างรายใหญ่ที่สุดที่มีพนักงานมากกว่า 100,000 คน นอกจากนี้ยังเป็นหนึ่งในร้านค้าปลีกที่ใหญ่ที่สุดในโลกสี่สิบแห่ง ด้วยการร่วมมือกับ Realstuff Informatik AG ผู้ให้บริการด้านไอทีในสวิตเซอร์แลนด์และผู้ค้าปลีกโซลูชัน SIOS นั้น Migros กำลังมองหาการแทนที่ระบบ ณ จุดขาย (POS) ด้วยแพลตฟอร์มใหม่ที่มีประสิทธิภาพมากขึ้นในการดำเนินงานและสามารถลดภัยคุกคามจากการหยุดทำงาน
ระบบ POS ใหม่ให้ข้อมูลราคาและการแบ่งประเภทผลิตภัณฑ์ในร้านค้า 650 แห่งของ Migros และผู้ค้าปลีกต้องการโซลูชันที่มีความพร้อมใช้งานสูงเพื่อรองรับการขายในแต่ละวัน หากไม่มีระบบ HA พนักงานจะไม่สามารถกำหนดราคาสินค้าหรือชั่งน้ำหนักสินค้าได้หากระบบขัดข้อง ส่งผลให้การปฏิบัติงานหยุดชะงัก หลังจากประเมินตัวเลือกต่างๆ Migros ตัดสินใจว่าต้องการสภาพแวดล้อมเซิร์ฟเวอร์โอเพ่นซอร์สที่ให้ความพร้อมใช้งานสูงและการปกป้องข้อมูลอย่างต่อเนื่อง เป็นอิสระจากสภาพแวดล้อมเสมือนจริง และสามารถดำเนินการภายในโดยเจ้าหน้าที่ไอทีของบริษัท เพื่อแก้ไขข้อกำหนดเหล่านี้ ทีมงานได้เลือก SIOS Protection Suite สำหรับ Linux สำหรับการจำลองแบบเพื่อปกป้องข้อมูล POS
สำหรับการออกแบบระบบ การฝึกอบรมลูกค้า และการสนับสนุนภาษาแม่ Realstuff ได้ร่วมมือกับ SIOS Competence and Support Center สำหรับยุโรปกลางและยุโรปตะวันออก ซึ่งตั้งอยู่ในเมืองเดรสเดน ประเทศเยอรมนี และดำเนินการโดย Computer Concept เป็นสิ่งสำคัญที่ Migros จะได้รับการสนับสนุนตลอด 24x7x365 ในช่วงเวลาสำนักงานภูมิภาคจากศูนย์ความสามารถและการสนับสนุน
Realstuff ใช้โซลูชันความพร้อมใช้งานสูงของ SIOS Protection Suite เพื่อตรวจสอบเซิร์ฟเวอร์ POS และทำซ้ำข้อมูลอย่างต่อเนื่อง ที่ที่ตั้งร้านค้าแต่ละแห่ง เซิร์ฟเวอร์สองแห่งถูกใช้เพื่อให้แน่ใจว่ามีการปกป้องข้อมูลอย่างต่อเนื่อง หากเซิร์ฟเวอร์หนึ่งล้มเหลว อินสแตนซ์ที่สองจะเข้ามาแทนที่งานในทันที นอกจากนี้ เซิร์ฟเวอร์ทั้งสองมิเรอร์สินทรัพย์ข้อมูลบนระบบการมอนิเตอร์อ่านกรณีศึกษาของ Migros ฉบับเต็มได้ที่นี่
ความคิดสุดท้าย
ศูนย์ความสามารถและการสนับสนุนระดับภูมิภาคได้ปรึกษากับ Realstuff เพื่อให้ข้อมูลเชิงลึกและทิศทางในการดำเนินการและเปิดตัว และดำเนินการฝึกอบรมเชิงปฏิบัติการเป็นเวลาสามวันเพื่อฝึกอบรมทีม Migros Richard Huber ผู้จัดการและสมาชิกคณะกรรมการบริหารของ Realstuff แสดงความคิดเห็นหลังการปรับใช้งานว่าประโยชน์ของโซลูชันความพร้อมใช้งานสูงของ SIOS คือความยืดหยุ่น ความน่าเชื่อถือ ความสะดวกในการใช้งาน และการรับประกันว่าข้อมูลจะได้รับการซิงค์ตลอดเวลา
วันนี้ Migros ได้ปฏิบัติตามข้อกำหนดสำหรับ HA ด้วยโซลูชันที่ใช้งานง่าย SIOS ซึ่งให้การตรวจสอบเซิร์ฟเวอร์ ที่เก็บข้อมูล แอปพลิเคชัน ฐานข้อมูล และการเชื่อมต่อเครือข่ายอย่างต่อเนื่อง เพื่อตรวจหาจุดล้มเหลว ลดการหยุดทำงาน รักษาการเชื่อมต่อไคลเอ็นต์ และให้บริการอย่างต่อเนื่อง การเข้าถึงข้อมูล
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโซลูชัน SIOS และวิธีที่ SIOS สามารถช่วยให้คุณบรรลุ HA ในสภาพแวดล้อม SQL Server คุณสามารถอ่าน “ทำไมต้องทำคลัสเตอร์สำหรับความพร้อมใช้งานสูงของเซิร์ฟเวอร์ SQL” ที่นี่