Date: มกราคม 18, 2019
การใช้งานแบบไดนามิกจะทำให้มีความพร้อมใช้งานสูงราคาไม่แพงและการขับเคลื่อนการโยกย้ายไปยังคลาวด์เพิ่มเติม
การจัดสรรตามความต้องการในคลาวด์นั้นไม่มีอะไรใหม่ สิ่งใหม่จะเป็นตัวเลือกที่ประหยัดค่าใช้จ่ายมากขึ้นสำหรับความพร้อมใช้งานสูงและการกู้คืนความเสียหายในไฮบริดและการกำหนดค่าระบบคลาวด์สาธารณะอย่างแท้จริง HA และ DR แบบออนดีมานด์ดังกล่าวจะใช้ประโยชน์จากการใช้ทรัพยากรแบบไดนามิกที่แพร่กระจายไปยังดาต้าเซ็นเตอร์หลายแห่งและภูมิภาคทางภูมิศาสตร์และทำให้การบริการระดับสูงมีราคาไม่แพงสำหรับแอพพลิเคชั่นมากขึ้น
ทั้ง HA และ DR ต้องการความซ้ำซ้อนเพื่อให้มั่นใจได้ว่าจะสามารถกู้คืนได้อย่างรวดเร็วจากความล้มเหลว
การทำคลัสเตอร์ล้มเหลว HA จะทำซ้ำสภาพแวดล้อมการทำงานเต็มรูปแบบของ VM หลักรวมถึง CPU หน่วยความจำและทรัพยากรหน่วยความจำใน VM รอง ข้อมูลทั้งหมดจะถูกเรพลิเคตแบบเรียลไทม์ไปยังข้อมูลรองซึ่งยังคงไม่ได้ทำงานจนกว่าจะมีข้อมูลหลักล้มเหลว การมี VM รองสำรองอย่างน้อยหนึ่งรายการขึ้นไปจะสร้างคลัสเตอร์ที่มีประสิทธิภาพในสถานะการทดสอบตัวเองอย่างต่อเนื่องดังนั้นจึงมั่นใจได้ว่ามีการเตรียมพร้อมสำหรับการ failover อัตโนมัติและรวดเร็ว
ตรงกันข้ามการกำหนดค่า DR พื้นฐานขาดความสามารถที่จำเป็นสำหรับการล้มเหลวอย่างรวดเร็ว
พิจารณาการกู้คืนไซต์ Azure Microsoft วางตำแหน่ง ASR ในฐานะ DR-as-a-service และตอนนี้ตลาด DRaaS ที่กำลังเติบโตรวมถึงข้อเสนอจากผู้ให้บริการเกือบโหล ด้วย ASR VMs หลักจะถูกจำลองแบบไปยังรุ่นที่สองในภูมิภาค Azure อื่น ๆ หรือจากอินสแตนซ์ในสถานที่ไปยังคลาวด์ Azure แต่ข้อมูลจะไม่ถูกจำลองแบบเรียลไทม์ บริการไม่สามารถตรวจจับและล้มเหลวโดยอัตโนมัติจากสาเหตุหลายประการของการหยุดทำงานในระดับแอปพลิเคชัน
ปัญหาพื้นฐาน
DRaaS และบริการความพร้อมใช้งานบนคลาวด์อื่น ๆ โดยทั่วไปตรวจพบการสูญเสียบริการทั้งหมด แต่ข้อผิดพลาดอันเนื่องมาจากแอพพลิเคชั่นหรือซอฟต์แวร์ระบบปฏิบัติการรวมถึงความล้มเหลวในทรัพยากรที่ไม่ต่อเนื่องเช่นเครือข่ายหรือที่จัดเก็บข้อมูลจะไม่ถูกตรวจจับ ดังนั้นแอปพลิเคชันบริการอาจถูกรบกวน – อาจเป็นระยะเวลานาน – โดยไม่ถูกตรวจพบโดยศูนย์กู้คืนข้อมูลของคลาวด์
SIOS DataKeeper และ SIOS Protection Suite จาก SIOS Technology
เมื่อความพร้อมใช้งานสูงมีความสำคัญยิ่งการตรวจหาข้อผิดพลาดที่ครอบคลุมนั้นเป็นสิ่งจำเป็นเพื่อหลีกเลี่ยงการหยุดทำงานของระดับแอปพลิเคชัน วัตถุประสงค์นี้เกิดขึ้นได้อย่างง่ายดายด้วยเทคโนโลยีการทำคลัสเตอร์การเฟลโอเวอร์ที่สร้างขึ้นตามวัตถุประสงค์เช่น SIOS DataKeeper และ SIOS Protection Suite จาก SIOS Technology ซึ่งสามารถตรวจจับสาเหตุการหยุดทำงานที่หลากหลายทั้งในซอฟต์แวร์ กลุ่มที่ใช้ซอฟต์แวร์เท่านั้นเหล่านี้อยู่บนชั้นบนคลาวด์เพื่อมอบโซลูชั่น HA / DR ที่สมบูรณ์ซึ่งรวมถึงการจำลองข้อมูลการตรวจสอบระดับแอปพลิเคชันอย่างต่อเนื่องและนโยบายการกู้คืนความล้มเหลว / ล้มเหลวที่กำหนดค่าได้
ข้อเสนอ DRaaS
ซอฟต์แวร์การทำคลัสเตอร์ล้มเหลวสามารถกำหนดค่าสำหรับ HA หรือ DR เพียงอย่างเดียวหรือสำหรับการรวมกันของ HA และ DR ปกติแล้ว DR จะมี VM สแตนด์บายในภูมิภาคอื่นในการกำหนดค่าที่เรียกว่า GeoCluster เช่นเดียวกับข้อเสนอ DRaaS ข้อ จำกัด แบนด์วิดท์ WAN ทำให้เกิด "ความล่าช้าในการจำลองแบบ" สำหรับข้อมูลและอาจสูญเสียข้อมูลบางอย่างภายใต้สถานการณ์ความล้มเหลวบางอย่าง แต่แตกต่างจาก DRaaS ความล้มเหลวในวงกว้างจะถูกตรวจพบโดยอัตโนมัติในแพลตฟอร์มคลาวด์และระดับแอปพลิเคชันและสามารถแก้ไขได้ทันทีเพื่อให้มั่นใจว่าบริการจะได้รับความต่อเนื่อง ในขณะที่การทำคลัสเตอร์ล้มเหลวด้วยความสามารถในการลดทั้งจุดกู้คืนและวัตถุประสงค์เวลาในการกู้คืน (RPO / RTO) ให้การปกป้องการบริการที่ครอบคลุมเมื่อเทียบกับ DRaaS จำเป็นที่จะต้องกำหนดค่าทรัพยากรซ้ำซ้อน โชคดีที่ปัญหานี้ได้รับการแก้ไขด้วยเทคนิคการจัดการคลัสเตอร์ที่สามารถจัดการการกู้คืนเต็มรูปแบบผ่านการจัดสรรทรัพยากรแบบไดนามิกในเวลาที่เกิดความล้มเหลว
แนวทางใหม่
VM แสตนด์บายขณะที่ทำงานในโหมดสแตนด์บายนั้นจะได้รับการกำหนดค่าเฉพาะกับทรัพยากรที่จำเป็นในการจัดการกับบทบาทที่เรียบง่ายของเป้าหมายการจำลองแบบข้อมูลสำหรับ VM หลัก เมื่อเกิดความล้มเหลวคลัสเตอร์ทันทีและตั้งค่า VM สแตนด์บายใหม่แบบไดนามิกพร้อมส่วนประกอบที่สมบูรณ์ของทรัพยากรที่จำเป็นในการส่งมอบระดับของประสิทธิภาพที่จำเป็นสำหรับบทบาทการดำเนินงานทั้งหมดของ VM หลัก การใช้ประโยชน์แบบไดนามิกนี้ช่วยให้การปกป้อง HA และ DR ได้รับประโยชน์จากการประหยัดต้นทุนอย่างมีนัยสำคัญโดยไม่ลดทอนความพร้อมใช้งานและประโยชน์ด้านความน่าเชื่อถือของการรวมกลุ่ม
ข้อสรุป
ทั้ง HA failover clusters และ DRaaS ไม่ว่าจะทำงานแยกกันหรืออยู่ในคอนเสิร์ตก็สามารถมีบทบาทในการทำให้การปกป้อง HA และ DR อย่างต่อเนื่องในราคาที่เหมาะสมสำหรับแอพพลิเคชั่นระดับองค์กรที่ครอบคลุม การหยุดทำงานสำหรับผู้ที่ต้องการ RPO เป็นศูนย์ (ไม่มีข้อมูลสูญหาย) และ RTO น้อยกว่าห้านาทีภายใต้สถานการณ์ความล้มเหลวที่อาจเกิดขึ้นทั้งหมด
เกี่ยวกับผู้แต่ง
Jerry Melnick เป็นประธานและซีอีโอของ SIOS Technology ซึ่งเขามีหน้าที่รับผิดชอบในการกำกับดูแลกลยุทธ์ขององค์กรโดยรวมและเป็นผู้นำในการเติบโตและขยายตัวของ บริษัท อย่างต่อเนื่อง เขามีประสบการณ์มากกว่า 25 ปีในตลาดองค์กรและตลาดซอฟต์แวร์ที่มีความพร้อมใช้งานสูง ก่อนที่จะร่วมงานกับ SIOS เขาเคยดำรงตำแหน่ง CTO ที่ Marathon Technologies ซึ่งเขาเป็นผู้นำด้านกลยุทธ์ทางธุรกิจและผลิตภัณฑ์สำหรับโซลูชั่นการป้องกันความผิดพลาดของ บริษัท ประสบการณ์ของเขายังรวมถึงตำแหน่งผู้บริหารที่ PPGx, Inc. และ Belmont Research ซึ่งเขารับผิดชอบในการสร้างผลิตภัณฑ์ซอฟต์แวร์ที่ทันสมัยและธุรกิจให้คำปรึกษาที่มุ่งเน้นการจัดหาคลังข้อมูลและเครื่องมือในการวิเคราะห์ เจอร์รี่เริ่มอาชีพของเขาที่ Digital Equipment Corporation ซึ่งเขาเป็นผู้นำหน่วยธุรกิจผู้ประกอบการที่นำเสนอแพลตฟอร์มฐานข้อมูลที่มีความสำคัญในการปรับขนาดได้สูงเพื่อรองรับสภาพแวดล้อมการประมวลผลขององค์กรในตลาดทางการแพทย์การเงินและโทรคมนาคม เขาสำเร็จการศึกษาระดับปริญญาตรีด้านวิทยาศาสตร์จากวิทยาลัยเบลัวต์จบการศึกษาระดับปริญญาตรีสาขาวิศวกรรมคอมพิวเตอร์และวิทยาศาสตร์คอมพิวเตอร์ที่มหาวิทยาลัยบอสตัน