Date: พฤศจิกายน 8, 2021
พื้นฐานการกู้คืนจากภัยพิบัติ
ภาพรวมการกู้คืนจากภัยพิบัติ
การกู้คืนจากภัยพิบัติหมายถึงความสามารถในการกู้คืน/ซ่อมแซมระบบอย่างรวดเร็ว และลดความเสียหายให้เหลือน้อยที่สุดในกรณีที่เกิดความล้มเหลวทั่วทั้งไซต์หรือแม้กระทั่งระดับภูมิภาค การกู้คืนข้อมูลหลังภัยพิบัติเป็นส่วนสำคัญของการจัดการความต่อเนื่องทางธุรกิจ และการมีโปรโตคอลการกู้คืนข้อมูลหลังภัยพิบัติที่มีประสิทธิภาพจะช่วยป้องกันการสูญเสียข้อมูลที่ไม่จำเป็นและค่าใช้จ่ายที่เกี่ยวข้องกับการหยุดทำงานของระบบ
อะไรคือส่วน ‘ภัยพิบัติ’ ของการกู้คืนจากภัยพิบัติ ซึ่งอาจหมายถึงภัยธรรมชาติ เช่น แผ่นดินไหว น้ำท่วม เป็นต้น แต่ยังรวมถึงเหตุการณ์ต่างๆ เช่น “ไฟไหม้” “การก่อการร้าย” “การบุกรุกโดยไม่ได้รับอนุญาต” “การแฮ็กขนาดใหญ่” และ “ขนาดใหญ่ในระยะยาว -ขนาดไฟฟ้าดับ” สิ่งใดก็ตามที่อาจก่อให้เกิดความเสียหายร้ายแรงต่อระบบไอทีหากเกิดความล้มเหลว
ผลกระทบที่แท้จริงของความล้มเหลวของระบบ
นอกเหนือจากความเสียหายทางกายภาพที่อาจเกิดขึ้นและการสูญหายของข้อมูลที่เกี่ยวข้องกับความล้มเหลวของระบบ การไม่มีแผนการกู้คืนจากความเสียหายอาจทำให้สูญเสียรายได้ที่ไม่สามารถกู้คืนได้สำหรับธุรกิจ ทุกๆ นาทีของการหยุดทำงานของระบบ นั่นหมายถึงการสูญเสียการขายและโอกาส ประสบการณ์ของลูกค้าในเชิงลบที่อาจเกิดขึ้น ชื่อเสียงทางธุรกิจที่มัวหมอง และค่าใช้จ่ายสูงในการซ่อมแซมไอทีฉุกเฉิน
ความสำคัญของการฟื้นฟูจากภัยพิบัติ
สำหรับบริษัทที่ให้บริการที่มีความสำคัญต่อภารกิจ การสร้างระบบความต่อเนื่องทางธุรกิจที่สามารถจัดการกับการหยุดทำงานของระบบที่ไม่คาดคิดได้นั้นเป็นสิ่งจำเป็น ความสามารถในการป้องกันความล้มเหลวตั้งแต่แรก และการกู้คืนอย่างรวดเร็วในกรณีที่เกิดความล้มเหลวในพื้นที่หรือแม้แต่ภัยพิบัติทั่วทั้งไซต์หรือระดับภูมิภาค จะช่วยปกป้องข้อมูล รักษาสายสัมพันธ์กับลูกค้า และประหยัดเวลาและการสูญเสียทางการเงินที่อาจร้ายแรง
สิ่งสำคัญคือต้องตระหนักว่าความล้มเหลวของระบบที่ร้ายแรงคือสิ่งที่จะเกิดขึ้น ไม่ใช่สิ่งที่จะเกิดขึ้น ดังนั้นการวางแผนการกู้คืนจากความเสียหายอย่างเหมาะสมจะช่วยปกป้องธุรกิจของคุณ
ความท้าทายในการกู้คืนจากภัยพิบัติ
แม้ว่าโปรโตคอลการกู้คืนจากความเสียหายจะมีความจำเป็น แต่ก็ใช่ว่าจะมีความท้าทายในการตั้งค่าและใช้งาน ต่อไปนี้คืออุปสรรคบางประการในการดำเนินการกู้คืนจากภัยพิบัติอย่างเหมาะสม: ความท้าทายที่ 1: การแบ่งแยกทางภูมิศาสตร์
สาระสำคัญของการป้องกันภัยพิบัติคือการรักษาระบบและข้อมูลไว้ในตำแหน่งที่แยกตามภูมิศาสตร์จากศูนย์ข้อมูลหลักหรืออินสแตนซ์ระบบคลาวด์ เพื่อที่ในกรณีที่เกิดภัยพิบัติหรือระบบคลาวด์ขัดข้อง ระบบสำรองสามารถออนไลน์และดำเนินการต่อไปได้
ความท้าทายที่ 2: ข้อกำหนดแบนด์วิดท์เครือข่าย การจำลองข้อมูลไปยังตำแหน่งภายนอกสำหรับการกู้คืนจากความเสียหายอาจหมายถึงความต้องการแบนด์วิดท์ของเครือข่ายที่เพิ่มขึ้นและปัญหาเวลาแฝง
ความท้าทายที่ 3: ปริมาณข้อมูลเพิ่มขึ้นอย่างต่อเนื่อง ข้อกำหนดด้านความจุของพื้นที่เก็บข้อมูลบนไซต์กู้คืนจากความเสียหายจะเพิ่มขึ้นเมื่อเวลาผ่านไป แผนการกู้คืนจากภัยพิบัติที่เหมาะสมจำเป็นต้องสร้าง “ลำดับความสำคัญในการป้องกัน” เพื่อชี้แจงว่าข้อมูลใดควรได้รับการปกป้องและเพิ่มประสิทธิภาพทรัพยากรการจัดเก็บข้อมูลที่มีอยู่
ความท้าทายที่ 4: ขั้นตอนการกู้คืนในขณะที่การกู้คืน หากระบบล่มเนื่องจากภัยพิบัติ จำเป็นต้องกู้คืนบริการ บ่อยครั้ง บริษัทต่างๆ พบว่าข้อมูลของพวกเขากระจัดกระจายอยู่ในหลายที่ และไม่มีขั้นตอนที่เป็นมาตรฐานสำหรับและการกู้คืน ส่งผลให้เสียเวลาและค่าใช้จ่ายมหาศาล การพัฒนาขั้นตอนการบูรณะที่ชัดเจนและได้มาตรฐานจะช่วยขจัดอาการปวดหัวนี้ และช่วยให้ดำเนินการได้อย่างรวดเร็วในยามที่สำคัญที่สุด
การสำรองข้อมูลเทียบกับการป้องกันความพร้อมใช้งาน
ตามธรรมเนียมแล้ว การสำรองข้อมูล – โดยพื้นฐานแล้วเป็นกระบวนการในการทำสำเนาข้อมูลและแอปพลิเคชันและย้ายไปยังตำแหน่งภายนอก – ได้ดำเนินการเพื่อวัตถุประสงค์ในการปกป้องข้อมูลในกรณีที่อุปกรณ์ไอทีขัดข้อง/ล้มเหลว และเพื่อการเก็บบันทึก/การเก็บถาวรตามระเบียบข้อบังคับ ข้อกำหนดเช่น HIPAA (Healthcare Information Portability Accountability Act) ในการกู้คืนการทำงาน เซิร์ฟเวอร์ พื้นที่เก็บข้อมูล และฮาร์ดแวร์อื่นๆ รวมถึงเครือข่ายที่ได้รับผลกระทบจากเหตุการณ์นั้นจำเป็นต้องเปลี่ยนหรือซ่อมแซม เซิร์ฟเวอร์ต้องได้รับการกำหนดค่าและต้องกู้คืนแอปพลิเคชัน นำกลับมาออนไลน์ และเชื่อมต่อกับข้อมูลที่กู้คืน ขั้นตอนเหล่านี้สามารถเป็นเดือน
หากไม่มีกระบวนการป้องกันความพร้อมใช้งาน การดำเนินการกู้คืนด้วยการสำรองข้อมูลเพียงอย่างเดียวอาจเป็นกระบวนการที่ใช้เวลานานและมีราคาแพง กระบวนการความพร้อมใช้งานช่วยให้ระบบปฏิบัติการเต็มรูปแบบพร้อมที่จะรับช่วงต่อในกรณีที่เกิดภัยพิบัติ ทำให้สามารถกลับมาให้บริการได้ในเวลาไม่กี่นาที
ต่อไปนี้คือสาเหตุทั่วไปบางประการที่แผนการกู้คืนข้อมูลหลังภัยพิบัติที่มีประสิทธิภาพมีความสำคัญ:
ตัวชี้วัดการกู้คืนจากภัยพิบัติ
ตัวชี้วัดหลักสำหรับการกู้คืนจากความเสียหายคือ “RPO” และ “RTO”
RPO (วัตถุประสงค์จุดกู้คืน) RPO ระบุจุดจากเวลาที่เกิดภัยพิบัติจนถึงเวลาที่ผ่านมาที่รับประกันการกู้คืนข้อมูล
ถ้า “RPO = < 5 นาที เมื่อมุ่งหมายสำหรับ “RPO = 0 (ข้อมูลสูญหายเป็นศูนย์)” จำเป็นต้องมีกลไกการป้องกันความพร้อมใช้งาน เช่น การทำคลัสเตอร์เมื่อเกิดข้อผิดพลาด
RTO (วัตถุประสงค์เวลาการกู้คืน) RTO คือดัชนีที่แสดงเวลาที่ธุรกิจของคุณอนุญาตให้ผ่านจากการหยุดทำงานครั้งแรกไปสู่การฟื้นฟูการดำเนินงาน “RTO = 1 เดือนขึ้นไป” คุณอาจสามารถจัดการการกู้คืนข้อมูลได้ด้วยการสำรองข้อมูลระยะไกลและรักษาความปลอดภัยให้กับอุปกรณ์ทดแทนเท่านั้น แต่ถ้า “RTO = ภายในไม่กี่นาที” จำเป็นต้องมีการทำคลัสเตอร์ล้มเหลว
การเลือกวิธีการกู้คืนจากภัยพิบัติ
เมื่อกำหนดวิธีการกู้คืนจากความเสียหายที่ถูกต้องสำหรับธุรกิจของคุณ ให้พิจารณาปัจจัยสำคัญเหล่านี้:
- ความสำคัญของกระบวนการทางธุรกิจและความอดทนต่อผลกระทบ
- ชนิดข้อมูลและความจุที่คุณต้องการปกป้อง
- ข้อกำหนดการกู้คืน – RPO และ RTO . ของคุณ
- งบประมาณ
มุ่งเน้นไปที่ผลกระทบทางธุรกิจ
ในขณะที่แผนกไอทีเป็นผู้นำทางเทคนิคในการพัฒนามาตรการการกู้คืนความเสียหายสำหรับระบบไอที เจ้าของธุรกิจต้องพิจารณาผลกระทบและขอบเขตของการหยุดทำงานของระบบต่อผลกระทบทางธุรกิจของแต่ละระบบที่หยุดทำงาน” เพื่อให้แน่ใจว่ามีผลกระทบน้อยที่สุดต่อธุรกิจ
ชนิดข้อมูลที่ได้รับการป้องกัน (ความสมบูรณ์ของข้อมูล)
การจัดประเภทและความสำคัญของข้อมูลที่ได้รับการคุ้มครองเป็นสิ่งสำคัญ สำหรับข้อมูลที่ไม่ต้องการความสม่ำเสมอที่แม่นยำมาก (เช่น ไฟล์เซิร์ฟเวอร์) การสำรองข้อมูลที่จัดเก็บข้อมูลหลักอย่างง่ายอาจเพียงพอ
ในทางกลับกัน ระบบ ERP และฐานข้อมูล เช่น SQL Server, Oracle และ SAP มีบริการและชิ้นส่วนที่หลากหลายซึ่งจำเป็นต้องระบุตำแหน่งบนเซิร์ฟเวอร์เฉพาะ เริ่มทำงานในคำสั่งซื้อเฉพาะ และจัดการตามแนวทางปฏิบัติที่ดีที่สุดเฉพาะแอปพลิเคชันที่หลากหลาย . โดยทั่วไปต้องมีการป้องกันความพร้อมใช้งานสูงและโซลูชันคลัสเตอร์ที่รับรู้แอปพลิเคชันเพื่อจัดการการเฟลโอเวอร์
———————————————————————————————————————
เงื่อนไขการกู้คืนจากภัยพิบัติที่สำคัญ
การสำรองข้อมูลระยะไกล – โดยพื้นฐานแล้วจะเก็บสำเนาของแอปพลิเคชันและข้อมูลไว้ในตำแหน่งระยะไกลที่แยกจากกันทางภูมิศาสตร์
มิเรอร์ที่เก็บข้อมูลแบบซิงโครนัส การรักษาสำเนาการจัดเก็บข้อมูลในเครื่องและระยะไกลให้ตรงกันสำหรับการป้องกัน DR ในวิธีนี้ ข้อมูลจะถูกเขียนไปยังที่จัดเก็บในตัวเครื่องและจำลองแบบทันทีไปยังที่เก็บข้อมูลระยะไกล ที่เก็บข้อมูลในเครื่องจะไม่ “ผูกมัด” จนกว่ากระบวนการเขียนข้อมูลไปยังตำแหน่งระยะไกลจะเสร็จสิ้น กระบวนการนี้ทำให้ทั้งสองสถานที่เหมือนกัน ขจัดความคลาดเคลื่อนที่อาจส่งผลให้หาก data-in-transit ในเวลาที่เกิดเหตุการณ์ไม่สามารถเขียนบนตำแหน่งระยะไกลได้ รับประกันความสมบูรณ์ของข้อมูลระหว่างไซต์หลักและไซต์สำรอง
มิเรอร์ที่เก็บข้อมูลแบบอะซิงโครนัส
วิธีนี้จะเขียนข้อมูลไปยังที่จัดเก็บในตัวเครื่องแล้วทำซ้ำไปยังตำแหน่งระยะไกล ช่วยให้มีประสิทธิภาพการใช้เครือข่ายมากขึ้นและลดความขัดแย้งของแบนด์วิดธ์เมื่อการแยกทางภูมิศาสตร์ทำให้เกิดเวลาแฝง
“สแตนด์บายเย็น” และ “สแตนด์บายร้อน”
สแตนด์บายเย็น กระบวนการเก็บสำเนาข้อมูลหรือระบบสำรองแบบออฟไลน์ในกรณีที่เกิดภัยพิบัติ หากระบบหลักหยุดทำงาน ระบบและซอฟต์แวร์ต้องเริ่มต้นด้วยตนเอง ในบางกรณีต้องกำหนดค่า และต้องกู้คืนข้อมูลก่อนจึงจะดำเนินการต่อได้
ร้อนสแตนด์บาย นี่เป็นกระบวนการที่ทำให้ระบบรองทำงานและเปลี่ยนไปใช้ระบบสำรองในกรณีที่ระบบหลักหยุดทำงาน
การเปรียบเทียบต้นทุนวิธีการกู้คืนจากภัยพิบัติ
RPO และ RTO ที่เล็กลง เวลาหยุดทำงานสั้นลง แต่ต้นทุนจะเพิ่มขึ้นตามไปด้วย
เมื่อพิจารณาถึงต้นทุนและมูลค่าสินทรัพย์ของข้อมูลแต่ละประเภทแล้ว จำเป็นต้องค้นหาวิธีการที่เหมาะสมที่สุดสำหรับระดับการป้องกันที่ต้องการ ความสมดุลระหว่างการใช้งานภายในองค์กรและการจ้างบริการภายนอกจะส่งผลกระทบต่อต้นทุน
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับความพร้อมใช้งานสูงและโซลูชันการกู้คืนระบบที่ SIOS คลิก ที่นี่ .