วิธีทำความเข้าใจและตอบสนองต่อการแจ้งเตือนความพร้อมใช้งาน

มกราคม 29, 2021 by Jason Aw Leave a Comment

ฮูสตันเรามีปัญหา (หรือวิธีทำความเข้าใจและตอบสนองต่อการแจ้งเตือนความพร้อมใช้งาน)

ความล้มเหลวที่ประสบความสำเร็จ

ฮูสตันพวกเรามีปัญหา!เป็นเส้นสัญลักษณ์ที่เตือนผู้ชื่นชอบอวกาศและแฟนภาพยนตร์จำนวนนับไม่ถ้วนเกี่ยวกับความยากลำบากภัยพิบัติที่อาจเกิดขึ้นและสถานะที่เต็มไปด้วยอันตรายของภารกิจอวกาศอพอลโล 13 ซึ่งปัจจุบันภารกิจของนาซ่าเรียกว่า "ความล้มเหลวที่ประสบความสำเร็จ" การเพิกเฉยต่อการแจ้งเตือนความพร้อมใช้งานของแอปพลิเคชันของคุณเองอาจไม่ได้ลดลงในประวัติศาสตร์เป็นช่วงเวลาที่กำหนด แต่ยังสามารถสร้างความหายนะที่คล้ายคลึงกันได้

ย้อนกลับไปในปี 1970:

“ การปั่นป่วนเป็นประจำของถังออกซิเจนทำให้ฉนวนสายไฟชำรุดเสียหายภายในถังทำให้เกิดการระเบิดซึ่งทำให้เนื้อหาของถังออกซิเจน (SM) ของโมดูลบริการ (Service Module) ทั้งสองไปอยู่ในอวกาศ หากไม่มีออกซิเจนซึ่งจำเป็นสำหรับการหายใจและในการสร้างพลังงานไฟฟ้าระบบขับเคลื่อนและช่วยชีวิตของ SM ไม่สามารถทำงานได้ ระบบของโมดูลคำสั่ง (CM) ต้องปิดตัวลงเพื่อสงวนทรัพยากรที่เหลือไว้สำหรับการส่งกลับโดยบังคับให้ลูกเรือย้ายไปยัง Lunar Module (LM) เป็นเรือชูชีพ เมื่อยกเลิกการลงจอดบนดวงจันทร์ผู้ควบคุมภารกิจจึงทำงานเพื่อนำลูกเรือกลับบ้าน”

การระเบิดของถังออกซิเจนทำให้เกิดสัญญาณเตือนคำเตือนแรงดันและแรงดันไฟฟ้าลดลงการสื่อสารที่ขัดข้องและจากนั้นการสื่อสารทางวิทยุที่มีชื่อเสียงในขณะนี้ระหว่างนักบินอวกาศและ Mission Controlแต่ถ้าหลังจากการระเบิดลูกเรือไม่ได้ทำอะไรเลย? จะเกิดอะไรขึ้นถ้าพวกเขาไม่เคยตรวจสอบการระเบิดไม่ตอบสนองต่อคำเตือนและมาตรวัดและไม่เคยแจ้ง Mission Control ว่ามีปัญหาจะเกิดอะไรขึ้นหาก Mission Control หลังจากได้รับแจ้งหรือแจ้งเตือนกลับมาที่แดชบอร์ดในศูนย์ควบคุมแล้วไม่เคยพยายามให้ความช่วยเหลือใด ๆจะเกิดอะไรขึ้นถ้าทีมฝังหัวของพวกเขาในทรายหรือลาออกจากตัวเองไปสู่ชะตากรรมและโอกาสไม่เคยพยายามเรียนรู้แสดงตัวหรือปรับปรุงจากความล้มเหลวที่พวกเขาพบผลลัพธ์ที่ได้จะน่าเศร้า!มันอาจจะกลายเป็นสารคดี แต่แทบจะไม่ใช่หนังบล็อกบัสเตอร์ที่มีเส้นสัญลักษณ์

คุณจะทำอย่างไรเมื่อมีการแจ้งเตือนในสภาพแวดล้อมของคุณ?

การเดินในอวกาศเป็นหนทางที่ห่างไกลจากกิจกรรมประจำวันของเราเองเว้นแต่คุณจะทำงานให้กับ NASA แต่บล็อกล่าสุดเกี่ยวกับ Apollo 13 ทำให้เกิดคำถามที่เกี่ยวข้องกับความพร้อมใช้งานคุณจะทำอย่างไรเมื่อมีการแจ้งเตือนเกิดขึ้นในสภาพแวดล้อมของคุณ? ทำเป็นเฉยๆไปหรือเปล่า?คุณมองข้ามมันไปรอดูว่าการแจ้งเตือนข้อความบันทึกหรือตัวบ่งชี้อื่น ๆ จะหายไปหรือไม่?คุณติดต่อฝ่ายสนับสนุนผู้จำหน่ายของคุณเพื่อทำความเข้าใจว่าคุณสามารถปิดใช้งานการแจ้งเตือนคำเตือนและข้อความเหล่านี้ได้อย่างไรหรือคุณพูดว่า“ เรามีปัญหาที่นี่และเราจำเป็นต้องแก้ไข”

ในฐานะรองประธานฝ่ายประสบการณ์ลูกค้าของ SIOS Technology Corp. เราได้รับการแจ้งเตือนและตัวบ่งชี้ทั้งสองด้านเราดำเนินการอย่างระมัดระวังกับลูกค้าที่เลือกที่จะเพิกเฉยต่อคำเตือนโดยปิดการแจ้งเตือนที่สำคัญที่ระบุปัญหาต่างๆตั้งแต่เกณฑ์การใช้งานไปจนถึงความไม่เสถียรของเครือข่ายไปจนถึงข้อมูลที่อาจไม่สอดคล้องกันและเรายังได้เห็นลูกค้าที่ติดตามการแจ้งเตือนของพวกเขาตรวจสอบว่าเหตุใดสัญญาณเตือนของพวกเขาจึงดับลงโดยเปิดเผยสาเหตุที่แท้จริงและมีความสุขกับผลงานของพวกเขาผลไม้นี้มักจะเป็นรางวัลอันหอมหวานของความมั่นคงนวัตกรรมและการเรียนรู้ที่ดีขึ้นหรือการหลีกเลี่ยงหายนะ

4 สิ่งที่คุณทำได้เมื่อผลิตภัณฑ์พร้อมจำหน่ายของคุณเรียกการแจ้งเตือน

1. ตรวจสอบว่าประเภทและความสำคัญของการแจ้งเตือนความพร้อมใช้งานหรือไม่

การแจ้งเตือนหรือข้อผิดพลาดบ่งบอกถึงคำเตือนข้อผิดพลาดหรือปัญหาร้ายแรงหรือไม่ สถานที่ที่ดีในการช่วยเหลือคุณและทีมของคุณด้วยความเข้าใจที่สำคัญคือการปรึกษากับเอกสารที่มีอยู่ ตรวจสอบเอกสารผลิตภัณฑ์ฟอรัมออนไลน์บทความฐานความรู้ (KBA) และข้อมูลภายในทีมและคู่มือการดำเนินการ

2. ประเมินความฉับไวของการแจ้งเตือน

สำหรับคำเตือนและข้อผิดพลาดพวกเขามีแนวโน้มที่จะก้าวไปสู่ปัญหาหรือเหตุการณ์ร้ายแรงเพียงใดสำหรับปัญหาที่สำคัญและการแจ้งเตือนสิ่งนี้อาจชัดเจน แต่การประเมินแม้เหตุการณ์ที่สำคัญจะให้คำแนะนำบางอย่างเกี่ยวกับขั้นตอนต่อไปของคุณ การแก้ไขตนเองการแยกปัญหาหรือการส่งต่อทันที

3. ปรึกษาแหล่งข้อมูลเพิ่มเติม

คุณสามารถเข้าถึงแหล่งข้อมูลอื่นใดเพื่อตัดสินใจเกี่ยวกับเงื่อนไขการแจ้งเตือน ตัวอย่างเช่นหากการแจ้งเตือนเกี่ยวข้องกับการจัดเก็บมีเครื่องมืออื่น ๆ ที่สามารถเปิดเผยความสมบูรณ์ของพื้นที่เก็บข้อมูลของคุณหรือไม่หากปัญหาคือการแจ้งเตือนเครือข่ายมีเครื่องมือไฮเปอร์ไวเซอร์เครื่องมือทราฟฟิกสถิติ NIC หรือเครื่องมือตรวจสอบพิเศษอื่น ๆ ที่ใช้งานเพื่อช่วยในการวิเคราะห์

4. ติดต่อฝ่ายสนับสนุน

กล่าวอีกนัยหนึ่งหากคุณไม่แน่ใจให้แจ้งเตือน Mission Control หลังจากกำหนดประเภทประเมินความฉับไวและปรึกษาแหล่งข้อมูลเพิ่มเติมแล้วคุณควรติดต่อผู้จำหน่ายเพื่อขอรับการสนับสนุนคำเตือนเกี่ยวกับเกณฑ์สำหรับการเรียก API อาจดูเหมือนไร้เดียงสา แต่หากการเรียก API ล้มเหลวเมื่อถึงขีด จำกัด ดังกล่าวอาจเป็นสาเหตุให้ดำเนินการทันที การขออำนาจจากผู้เชี่ยวชาญจะเป็นประโยชน์ในการรักษาความอุ่นใจและหลีกเลี่ยงภัยพิบัติ

ผู้จำหน่ายที่มีประสบการณ์เช่น SIOS สามารถช่วยคุณระบุสาเหตุของปัญหาได้อย่างรวดเร็วและแนะนำวิธีแก้ไขปัญหาที่ดีที่สุด

การเพิกเฉยต่อปัญหาในสภาพแวดล้อมความพร้อมใช้งานของคุณซ้ำ ๆ อาจทำให้เกิดปัญหาที่ไม่คาดคิด แต่ผลลัพธ์ที่ร้ายแรงไม่น้อยกว่า การจัดการปัญหาที่ระบุโดยการแจ้งเตือนข้อความบันทึกตัวบ่งชี้คำเตือนหรือตัวบ่งชี้อื่น ๆ ที่ติดตั้งและกำหนดค่าไว้จะช่วยให้ลูกค้าของคุณธุรกิจของคุณทีมของคุณและตัวคุณเองมี“ โอกาสในการแก้ไขปัญหา” ก่อนที่จะเกิดภัยพิบัติ และในขณะเดียวกันก็เพิ่มความแข็งแกร่งให้กับกลยุทธ์ความพร้อมใช้งานและโครงสร้างพื้นฐานของคุณคุณจะเลือกแบบไหน?

– Cassius Rhue รองประธานฝ่ายประสบการณ์ลูกค้า

ผลิตซ้ำจาก SIOS

ฉันต้องการซอฟต์แวร์ความพร้อมใช้งานสูงในระบบคลาวด์หรือไม่?

มกราคม 23, 2021 by Jason Aw Leave a Comment

ฉันต้องการซอฟต์แวร์ความพร้อมใช้งานสูงในระบบคลาวด์หรือไม่?

ให้ฉันเขย่าความทรงจำของคุณ . .

บางทีวันนี้คุณไม่มีความล้มเหลวในช่วงหลายสิบเดือนหรือมากกว่านั้นและทันใดนั้นการต่ออายุ slam dunk สำหรับใบอนุญาตซอฟต์แวร์ที่มีความพร้อมใช้งานสูงของคุณก็อยู่ภายใต้เส้นแดงของปากกาของ CFOหรืออาจเป็นเพราะส่วนหนึ่งมาจากการใช้คำศัพท์มากเกินไปการตลาดที่ชาญฉลาดหรือการนิยามความพร้อมใช้งานสูง CIO ของคุณซึ่งครั้งหนึ่งเคยเป็นพัดลมที่มีความพร้อมใช้งานยากที่สุดได้เริ่มลังเลกับคุณค่าของมันหรือบางทีอาจไม่ใช่ CFO หรือ CIO แต่เป็นคุณที่ตัดสินใจว่าคุณอาจมี HA เพียงพอโดยไม่จำเป็นต้องมีซอฟต์แวร์ที่พร้อมใช้งานสูงหรือสูงกว่าในสมการ

ในขณะที่ระบบคลาวด์สาธารณะมีความยืดหยุ่นอย่างไม่น่าเชื่อและได้รับการพิจารณาความพร้อมใช้งานในหลาย ๆ ช่วงเวลา แต่ความต้องการซอฟต์แวร์ที่มีความพร้อมใช้งานสูงที่มีเสถียรภาพและบำรุงรักษาได้ยังคงเป็นความจริงในปัจจุบันลองพิจารณาปี 2020 ความก้าวหน้าในการประมวลผลแบบคลาวด์สาธารณะและความพร้อมใช้งานยังไม่สามารถป้องกันอุบัติเหตุทั่วไปเช่นการปฏิบัติที่ไม่ถูกต้องและรหัสที่ไม่ดีที่ทำให้แอปพลิเคชันขัดข้องศูนย์ข้อมูลที่ไม่เปิดเผยความล้มเหลวการก่อสร้างแบบไม่ระบุชื่อที่ส่งผลต่อพลังงานหรือเครือข่ายความจุเกินพิกัดบน VM หรือระบบระบายความร้อนล้มเหลวตามที่ระบุไว้ในบทความ CRN หนึ่งบทความ

นี่คือเหตุผล 7 ประการที่คุณยังต้องการซอฟต์แวร์ที่มีความพร้อมใช้งานสูงกว่าในระบบคลาวด์:

1. เพื่อเพิ่มความลึกและความครอบคลุมของแอปพลิเคชันสำหรับแอปพลิเคชันระดับองค์กรที่สำคัญที่สุดของคุณ

ไม่มีผู้จำหน่ายระบบคลาวด์รายเดียวที่จะมีเครื่องมือซอฟต์แวร์และแอปพลิเคชันทั้งหมดที่คุณต้องการรวมไว้ในโครงสร้างพื้นฐานระบบคลาวด์ในแบบที่องค์กรของคุณสามารถใช้งานได้ด้วยเหตุนี้คุณจึงอาจย้ายปริมาณงานไปยังระบบคลาวด์ไปยังข้อเสนอของ IaaS ที่ต้องการใครสักคนหรือบางสิ่งเพื่อปกป้องปริมาณงานเหล่านี้และตรวจสอบให้แน่ใจว่ามีพร้อมใช้งานสูง

2. สำหรับการกู้คืนแอปพลิเคชันอัตโนมัติและชาญฉลาดของระบบทรัพยากรและการอ้างอิง

ผู้ขายระบบคลาวด์รู้เรื่องเมฆ ผู้ขายที่มีความพร้อมใช้งานสูงทราบดีเกี่ยวกับความพร้อมใช้งานสูงของแอปพลิเคชัน เมื่อใดหากความล้มเหลวเกิดขึ้นในระบบคลาวด์แอปพลิเคชันของคุณต้องการการกู้คืนส่วนประกอบที่ล้มเหลวอย่างชาญฉลาด ระบบทรัพยากรแอปพลิเคชันส่วนประกอบโครงสร้างพื้นฐานและการอ้างอิงในฐานะผู้เชี่ยวชาญด้านความพร้อมใช้งานผู้จำหน่ายซอฟต์แวร์ของคุณมีความรู้ที่ครอบคลุมในการป้องกันแอปพลิเคชัน ในผลิตภัณฑ์ SIOS Protection Suite สำหรับ Linux ระบบอัตโนมัติที่ใช้วิซาร์ดโดยใช้แนวทางปฏิบัติที่ดีที่สุดในอุตสาหกรรมและประวัติอันยาวนานของความเชี่ยวชาญด้านแอปพลิเคชันช่วยผลักดันการกู้คืนแอปพลิเคชันโดยอัตโนมัติอย่างชัดเจนในสถานการณ์ความล้มเหลว

3. สำหรับการจำลองข้อมูลระดับบล็อกอัจฉริยะสำหรับแอปพลิเคชันของคุณการเพิ่มความยืดหยุ่นของคุณในกรณีที่ระบบเสียขวัญหรือดาต้าเซ็นเตอร์หยุดทำงาน

ความครอบคลุมของแอปพลิเคชันและการกู้คืนที่สมดุลและชาญฉลาดจะเกิดขึ้นได้เมื่อข้อมูลมีอยู่ในระบบสแตนด์บายในกรณีที่เกิดความล้มเหลวเมื่อผู้จำหน่าย HA ของคุณมีการจำลองข้อมูลระดับบล็อกคุณจะสามารถขยายความยืดหยุ่นในการล้มเหลวของแอปพลิเคชันของคุณนอกเหนือจากศูนย์ข้อมูลหรือภูมิภาคเดียวไปยังศูนย์ข้อมูลและภูมิภาคหลายแห่งการจำลองข้อมูลระดับบล็อกยังเป็นวิธีที่มีประสิทธิภาพในการหลีกเลี่ยงค่าฮาร์ดแวร์ที่ส่งผลกระทบต่อปริมาณคลาวด์ในศูนย์ข้อมูลเดียวเหตุการณ์บนคลาวด์หนึ่งที่เกี่ยวข้องกับระบบจ่ายไฟของศูนย์ข้อมูลและความล้มเหลวของเครื่องกำเนิดไฟฟ้าในภายหลังส่งผลให้ฮาร์ดแวร์เสียหายและข้อมูลสูญหายสำหรับอินสแตนซ์ที่ทำงานในศูนย์ข้อมูลเดียวระบบคลาวด์ไม่ได้หมายความว่าคุณจะปลอดภัยอย่างสมบูรณ์จากความล้มเหลวทั้งหมดและต้องมีการสำรองข้อมูลตลอดจนสำเนาการจำลองข้อมูลที่มีอยู่สูง

4. สำหรับกลไกการตอบสนองที่เร็วขึ้นสำหรับการตรวจจับและแก้ไขปัญหา

ซอฟต์แวร์ HA ของคุณเป็นด่านแรกสำหรับการระบุและแก้ไขข้อผิดพลาดของแอปพลิเคชันด้วยการมอนิเตอร์ daemons ความล้มเหลวของแอปพลิเคชันสามารถตรวจพบและแก้ไขได้อย่างรวดเร็วโดยซอฟต์แวร์ก่อนที่ผู้ใช้จะได้รับผลกระทบร้ายแรงนอกจากนี้ซอฟต์แวร์ที่มีความพร้อมใช้งานสูงของคุณเช่นโซลูชัน SIOS Protection Suite สำหรับ Linux ยังมีวิธีการที่กำหนดค่าได้สำหรับการส่งและการแจ้งเตือนไปยังผู้ดูแลระบบคอนโซลเหตุการณ์หรือแดชบอร์ดซึ่งช่วยให้คุณสามารถสื่อสารกับคีย์ได้ทันทีและมีประสิทธิภาพ

5. สำหรับแหล่งข้อมูลเพิ่มเติมที่สามารถขุดและตรวจสอบได้เพื่อช่วยทำนายสุขภาพและความมั่นคงขององค์กรของคุณ

ข้อมูลคือราชาซอฟต์แวร์ที่มีความพร้อมใช้งานสูงของคุณเป็นแหล่งข้อมูลและข้อมูลมากมายเกี่ยวกับสภาพแวดล้อมของคุณที่สามารถขุดและตรวจสอบได้เนื่องจากโซลูชัน HA ของคุณตอบสนองต่อความล้มเหลวของแอปพลิเคชันปัญหาโครงสร้างพื้นฐานและเวลาในการตอบสนองและขับเคลื่อนเวลาทำงานของคุณผ่านความล้มเหลวชั่วคราวบันทึกของพวกเขาจะรวบรวมข้อมูลที่สำคัญเกี่ยวกับความสมบูรณ์ขององค์กรของคุณในฐานะรองประธานฝ่ายประสบการณ์ลูกค้าทีมความสำเร็จของลูกค้าและฝ่ายสนับสนุนของเราสามารถใช้บันทึก HA ของเราเพื่อตรวจสุขภาพให้กับลูกค้าโดยแจ้งให้พวกเขาทราบถึงปัญหาการใช้งานหลายอย่างและการปรับให้เหมาะสมที่เป็นไปได้เนื่องจากข้อมูลบันทึกที่บันทึกไว้

6. สำหรับมุมมองที่สมดุลและเป็นความจริงและภูมิปัญญาเสริมที่จำเป็นสำหรับองค์กรของคุณ

นอกเหนือจากมูลค่าของซอฟต์แวร์ High Availability แล้วยังมีอีกสาเหตุหนึ่งที่คุณยังต้องการซอฟต์แวร์ HA ในระบบคลาวด์เหตุผลเพิ่มเติมนั้นคือมุมมองที่สมดุลและตรงตามความจริงและภูมิปัญญาเสริมของทีมพัฒนาบริการและประสบการณ์ลูกค้าของผู้ขาย HA ของคุณซอฟต์แวร์ HA ของคุณได้รับการสนับสนุนโดยทีมงานผู้เชี่ยวชาญวิศวกรความพร้อมใช้งานที่มีประสบการณ์และที่สำคัญที่สุดคือบริการและทีมสนับสนุนที่มีประสบการณ์ในการปฏิบัติที่ดีที่สุดความรู้เฉพาะด้านแอปพลิเคชันตลอดจนแนวคิดและทักษะที่ผสมเกสรซึ่งจะเป็นประโยชน์ต่อองค์กรของคุณอย่างมาก

7. เพื่อลดเวลาหยุดทำงานของการบำรุงรักษาตามแผน

สุดท้าย แต่ไม่ท้ายสุดซอฟต์แวร์ความพร้อมใช้งานที่สูงขึ้นของคุณจะช่วยลดหรืออาจกำจัดเวลาหยุดทำงานที่จำเป็นสำหรับการอัปเกรดแพตช์เล็กน้อยและการบำรุงรักษาเชิงป้องกันด้วยการใช้ความสามารถในการสลับและเฟลโอเวอร์ของซอฟต์แวร์ HA ของคุณเซิร์ฟเวอร์สแตนด์บายของคุณจะได้รับการแก้ไขอัปเดตและทดสอบอย่างแข็งขันจากนั้นเลื่อนระดับให้เป็นโหนดความพร้อมใช้งานที่ใช้งานอยู่ดังนั้นจึงมั่นใจได้ว่าระบบที่สำคัญของคุณกำลังทำงานในรุ่นล่าสุดในขณะที่ลดโทษของการอัพเกรดให้น้อยที่สุด

ใช่คลาวด์ได้เพิ่มความเสถียรของฮาร์ดแวร์และแพลตฟอร์มสำหรับแอปพลิเคชันนักพัฒนาและผู้ใช้ระดับองค์กร แต่ถ้าคุณเริ่มคิดว่าไม่ต้องการความพร้อมใช้งานสูงคุณกำลังมุ่งหน้าไปตามตรอกมืดที่จบลงด้วยความสิ้นหวังในช่วงสาย คืนพิซซ่าเย็น ๆ ทำให้แอปพลิเคชันกลับมาออนไลน์อธิบายถึงสิ่งที่อธิบายไม่ได้และใคร่ครวญถึงการปัดฝุ่นเรซูเม่ขอบคุณมากที่ให้ฉันเขย่าความทรงจำของคุณ . .คุณและซอฟต์แวร์ HA ของคุณต้องการกันและกันแม้กระทั่งในระบบคลาวด์

– Cassius Rhue รองประธานฝ่ายประสบการณ์ลูกค้า

ทำซ้ำโดยได้รับอนุญาตจาก SIOS

ฉันควรใช้ Zabbix ใน AWS หรือไม่

มกราคม 16, 2021 by Jason Aw Leave a Comment

ฉันควรใช้ Zabbix ใน AWS หรือไม่

การตรวจสอบ Amazon EC2

Zabbix มีส่วนแบ่งการตลาดสูงในฐานะเครื่องมือตรวจสอบ OSS ในตัวแม้ว่าจะมีการใช้กันอย่างแพร่หลายในสภาพแวดล้อมภายในองค์กร แต่ก็มีตัวอย่างมากมายของ Zabbix ที่ใช้ในสภาพแวดล้อม AWSแม้ว่า AWS จะมีบริการตรวจสอบเช่น Amazon CloudWatch ด้วยเหตุใดคุณจึงควรใช้ Zabbixส่วนนี้อธิบายถึงประโยชน์ของการมอนิเตอร์อินสแตนซ์ EC2 และอินสแตนซ์อื่น ๆ ตลอดจนกระบวนการกำหนดค่า

เหตุใดจึงต้องใช้ Zabbix แทน Amazon CloudWatch

ในสภาพแวดล้อม AWS โครงสร้างพื้นฐานทั้งหมดจะดำเนินการโดย AWS แต่คุณต้องรับผิดชอบต่อการทำงานของอินสแตนซ์ Amazon EC2 ด้วยตนเองและแอปพลิเคชันที่สร้างบน Amazon EC2 กล่าวอีกนัยหนึ่งคุณต้องตรวจสอบแอปพลิเคชันเพื่อให้แน่ใจว่าแอปพลิเคชันทำงานได้อย่างถูกต้องและคุณต้องดำเนินการเมื่อเกิดปัญหาขึ้นZabbix เป็นตัวเลือกที่ดีสำหรับเครื่องมือตรวจสอบประเภทนี้

Zabbix มีข้อได้เปรียบในการตรวจสอบไม่เพียง แต่ในสถานที่ แต่ยังรวมถึงสภาพแวดล้อมระบบคลาวด์และเสมือนในลักษณะบูรณาการ

ในขณะที่มาตรฐาน Amazon CloudWatch จำกัด เฉพาะการตรวจสอบทรัพยากร AWS (CPU หน่วยความจำ ฯลฯ ) Zabbix ช่วยให้คุณสามารถตรวจสอบสถานะของแอปพลิเคชันของคุณได้อย่างละเอียด

ต่อไปนี้เป็นรายการข้อดีอื่น ๆ ของ Zabbix

การตรวจสอบสภาพแวดล้อมแบบบูรณาการกับบัญชี AWS หลายบัญชี

Amazon CloudWatch ทำการตรวจสอบตามบัญชี AWSZabbix สามารถตรวจสอบสภาพแวดล้อมของบัญชี AWS หลายบัญชีซึ่งสามารถตรวจสอบระบบธุรกิจที่ประกอบด้วยหลายบัญชีนอกจากนี้ยังสามารถตรวจจับความผิดปกติไม่เพียง แต่โดยการแจ้งเตือนธรรมดาตามเกณฑ์เท่านั้น แต่ยังรวมถึงเกณฑ์และเงื่อนไขหลายรายการร่วมกัน

สามารถกำหนดค่าด้วยการแจ้งเตือนโดยละเอียดเพื่อให้เหมาะกับสภาพการทำงานจริง

Amazon CloudWatch สามารถแจ้งเตือนคุณด้วยข้อความในกรณีที่เกิดความผิดปกติตัวอย่างเช่นหากระบบของคุณหยุดการบำรุงรักษาคุณไม่จำเป็นต้องได้รับการแจ้งเตือนทางข้อความนี่คือจุดที่ Zabbix อนุญาตให้คุณกำหนดค่ากรณีเหล่านี้ในลักษณะที่ช่วยให้คุณสามารถระงับข้อความที่ไม่ต้องการวิธีนี้จะช่วยให้มั่นใจได้ว่าคุณจะได้รับการแจ้งเตือนเมื่อมีสิ่งผิดปกติที่จำเป็นต้องได้รับการแก้ไขเท่านั้น

ไม่มีระยะเวลาการเก็บรักษาสำหรับเมตริก (บันทึกการตรวจสอบ)

ด้วย Amazon CloudWatch สามารถจัดเก็บเมตริกได้นานถึง 15 เดือนยิ่งไปกว่านั้นคุณสามารถจัดเก็บเมตริกได้ทีละชั่วโมงเป็นเวลา 15 เดือนและหากกำหนดช่วงเวลาการตรวจสอบไว้น้อยกว่า 60 วินาทีคุณจะจัดเก็บได้สูงสุด 3 ชั่วโมงเท่านั้นZabbix ช่วยให้สามารถจัดเก็บเมตริกได้ในระยะยาวโดยไม่ต้องเปลี่ยนรายละเอียดของข้อมูล

วิธีตรวจสอบสภาพแวดล้อม AWS ด้วย Zabbix

หากคุณต้องการใช้ Zabbix ใน AWS คุณจะต้องสร้างอินสแตนซ์ Amazon EC2 และ DB และติดตั้ง Zabbixหลังการติดตั้งขั้นตอนการกำหนดค่า Zabbix จะเหมือนกับในองค์กรยกเว้นว่าคุณจะต้องตั้งค่าสิ่งต่อไปนี้

บัญชีผู้ใช้ (นอกเหนือจากผู้ใช้ผู้ดูแลระบบของ Zabbix คุณจะต้องสร้างผู้ใช้สำหรับการใช้งานจริง)
ตัวแทนโฮสต์ Zabbix (กำหนดว่าจะรวบรวมข้อมูลจากที่ใด)
รายการ (ตั้งค่าข้อมูลที่จะรวบรวม)
ทริกเกอร์ (กำหนดสถานะของข้อมูลที่ผิดปกติ)
การดำเนินการ (กำหนดการดำเนินการเมื่อเกิดข้อผิดพลาด)

นอกจากนี้คุณสามารถกำหนดการตั้งค่าเฉพาะ AWS ได้เช่นการสร้างผู้ใช้ใน AWS IAM ด้วยสิทธิ์ที่จำเป็นสำหรับ Zabbix ซึ่งจะช่วยให้ Zabbix ตรวจสอบแอปพลิเคชันและสภาพแวดล้อม AWS ในแง่มุมอื่น ๆ

ใช้เครื่องมือที่เหมาะสมกับความต้องการในการตรวจสอบของคุณ

ระบบขององค์กรบางระบบไม่ได้ดำเนินการแยกกัน แต่มีการเชื่อมโยงระบบหลายระบบเข้าด้วยกันเพื่อแลกเปลี่ยนข้อมูลและรับรองความสอดคล้องกันในสภาพแวดล้อมเหล่านี้ Zabbix เป็นเครื่องมือที่ยอดเยี่ยมสำหรับการตรวจสอบและตรวจจับความผิดปกติในเซิร์ฟเวอร์และระบบต่างๆตัวอย่างเช่นหากเว็บแอปพลิเคชันที่ใช้ฐานข้อมูลมีความผิดปกติบนเว็บแอ็พพลิเคชันเซิร์ฟเวอร์ก็สามารถปิดใช้งานข้อมูลได้เช่น

ในทางกลับกัน Zabbix มีตัวเลือกการกำหนดค่ามากมายดังนั้นคุณจะต้องตัดสินใจว่าจะตรวจสอบอะไรอย่างไรและเงื่อนไขใดที่ผิดปกติ

ในทางกลับกัน Zabbix มีการตั้งค่ามากมายดังนั้นคุณต้องออกแบบการทำงานให้ชัดเจนว่าจะตรวจสอบอะไรและจะทำอย่างไรกับมันและจะทำอย่างไรกับมัน แน่นอนว่าสำหรับระบบที่สำคัญการออกแบบนั้นเป็นสิ่งสำคัญอย่างไรก็ตามสำหรับระบบที่ค่อนข้างเรียบง่ายเช่น“ ถ้ากระบวนการหยุดเพียงแค่เริ่มต้นใหม่” จะไม่มีการตรวจสอบ Zabbix ที่ตรงกันSIOS AppKeeper เป็นทางออกที่ดีสำหรับกรณีดังกล่าวเนื่องจากตรวจสอบบริการ (กระบวนการ) ของแอปพลิเคชันที่ทำงานบนอินสแตนซ์ EC2 และรีสตาร์ทแอปพลิเคชันหากตรวจพบปัญหา ทำให้สามารถตรวจสอบและใช้งานได้ง่าย

แน่นอนว่าการใช้ Zabbix ในทุกระบบนั้นไม่ "บังคับ"ด้วยการใช้เครื่องมือที่เหมาะสมสำหรับการตรวจสอบแต่ละประเภทคุณจะสามารถใช้งานระบบของคุณได้อย่างมีประสิทธิภาพมากขึ้น

เพิ่ม SIOS AppKeeper ในการตรวจสอบและการกู้คืน EC2 ของคุณ

ผลิตซ้ำจาก SIOS

วิธีเลือกคลาวด์เมื่อคุณต้องการความพร้อมใช้งานสูง

มกราคม 8, 2021 by Jason Aw Leave a Comment

วิธีเลือกคลาวด์เมื่อคุณต้องการความพร้อมใช้งานสูง

ทำความเข้าใจตลาดคลาวด์

บริษัท นักวิเคราะห์หลายแห่งคาดการณ์ว่าจะมีการปรับใช้แอปพลิเคชันฐานข้อมูลและโซลูชันในระบบคลาวด์ที่เพิ่มขึ้นอย่างต่อเนื่อง ตามรายงานของ Gartner บริษัท ต่างๆ“ กำลังย้ายไปใช้ระบบคลาวด์ในอัตราที่เพิ่มข^[1]ึ้น” ในความเป็นจริง Gartner และนักวิเคราะห์คนอื่น ๆ คาดว่าการย้ายและการปรับใช้ระบบคลาวด์จะยังคงเร่งตัวขึ้นอย่างต่อเนื่องโดยส่วนใหญ่เป็นผลมาจากการสร้างสรรค์นวัตกรรมในระบบคลาวด์ ในบทความ TechTarget โดย Kurt Marko จาก MarkoInsights มาร์โคตั้งข้อสังเกตว่านวัตกรรมที่“ ดำเนินการในระบบคลาวด์นั้นไม่สามารถจำลองแบบในสถานที่ได้เนื่องจากลักษณะที่ยืดหยุ่นปรับขนาดได้และตามความต้องการของระบบคลาวด์สาธารณะที่มีการจัดการ บริการ”

เราเห็น บริษัท จำนวนมากขึ้นเรื่อย ๆ ที่ใช้ระบบคลาวด์เฉพาะสำหรับแอปพลิเคชัน DevOps และฐานข้อมูลที่ไม่จำเป็นต่อธุรกิจของพวกเขาขณะนี้กำลังย้ายแอปพลิเคชันที่มีความสำคัญต่อภารกิจ ERP และฐานข้อมูลที่ต้องการการป้องกันความพร้อมใช้งานสูงไปยังระบบคลาวด์

หากคุณกำลังพิจารณาที่จะย้ายไปยังระบบคลาวด์ – และดูเหมือนว่าคุณจะเป็นเช่นนั้น – มีกุญแจมากมายที่ต้องทำความเข้าใจเมื่อคุณต้องการความพร้อมใช้งานสูง

ทำความคุ้นเคยกับตัวเลือกความพร้อมใช้งานสูงบนคลาวด์

ในการวางแผนหาโซลูชันความพร้อมใช้งานที่เหมาะสมสำหรับการปรับใช้ระบบคลาวด์หรือไฮบริดคลาวด์ให้พิจารณาประเด็นปัญหาเกี่ยวกับความพร้อมใช้งาน (เวลาพร้อมใช้งาน 99.9%) และความพร้อมใช้งานสูง (เวลาพร้อมใช้งาน 99.99%) นอกจากนี้คุณยังต้องเข้าใจตัวเลือกที่พร้อมใช้งานสำหรับความพร้อมใช้งานสูงโดยคำนึงถึงแผนการโยกย้ายไปยังระบบคลาวด์ นักวิเคราะห์และผู้เชี่ยวชาญที่มีชื่อเสียงแนะนำให้มองหาโซลูชันที่ไม่เพียง แต่จะบรรเทาและลดความเจ็บปวดจากการโยกย้ายปริมาณงานของคุณ แต่ยังมอบแนวทางที่สมดุลและครอบคลุมในการใช้งานตลอดอายุการใช้งานสถาปัตยกรรมคลาวด์ของคุณ โปรดทราบว่าควรพิจารณาโซลูชันที่สามารถให้การป้องกันและความพร้อมใช้งานสูงสำหรับบางส่วนของปริมาณงานของคุณซึ่งวันหนึ่งอาจส่งตัวกลับจากระบบคลาวด์กลับสู่สภาพแวดล้อมภายในองค์กรของคุณ

สิ่งที่ควรพิจารณา 10 ประการเมื่อเปรียบเทียบตัวเลือกความพร้อมใช้งานในระบบคลาวด์มีดังนี้

1. วิธีการปรับใช้ เป็นไปได้หรือไม่ที่จะปรับใช้โซลูชันความพร้อมใช้งานที่คุณกำลังพิจารณาโดยใช้อิมเมจ CLI UI หรือโซลูชันที่ทำซ้ำได้อื่น ๆ เช่นเทมเพลตการสร้างคลาวด์หรือสคริปต์แพ็กเกจ

2. ความต้องการของระบบโดยเฉพาะอย่างยิ่งพิจารณาความต้องการของระบบปฏิบัติการ (OS), ดิสก์, CPU และหน่วยความจำ

3. สภาพแวดล้อมการปรับใช้ตัวเลือกความพร้อมใช้งานของคุณรองรับเฉพาะในองค์กรระบบคลาวด์สาธารณะอย่างน้อยหนึ่งระบบหรือสามารถรองรับการใช้งานแบบผสมผสานและ / หรือการปรับใช้ระบบคลาวด์แบบไฮบริด มีบริการ SaaS ด้วยหรือไม่?

4. ความกว้างและความลึกของการป้องกันแอปพลิเคชัน “ ความกว้าง” หมายถึงประเภทของแอปพลิเคชันฐานข้อมูลส่วนหน้าระบบเครือข่ายและส่วนประกอบโครงสร้างพื้นฐานที่สามารถป้องกันได้มีกรอบงานที่ยืดหยุ่นสำหรับการเพิ่มแอปพลิเคชันและตัวแปรใหม่ ๆ หรือไม่? “ ความลึก” หมายถึง – โซลูชันที่แอปพลิเคชันรับรู้ – และสามารถรักษาแนวทางปฏิบัติที่ดีที่สุดเฉพาะแอปพลิเคชันตลอดกระบวนการเฟลโอเวอร์ / เฟลแบ็คของแอปพลิเคชันได้หรือไม่

5. ต้องการประสิทธิภาพการทำงาน. เรามักจะนึกถึง RTO และ RPO แต่สิ่งที่เกี่ยวกับความต้องการด้านประสิทธิภาพอื่น ๆ ของโซลูชันของคุณ โซลูชันความพร้อมใช้งานของคุณจะทำให้เกิดปัญหาด้านประสิทธิภาพในการล้มเหลวหรือไม่

6. ข้อกำหนดด้านความยืดหยุ่นคลัสเตอร์ขนาดใหญ่เพียงใดที่โซลูชันความพร้อมใช้งานสามารถรองรับได้?, สามารถตรวจจับและกู้คืนข้อผิดพลาดและความล้มเหลวได้กี่ข้อ การจำลองแบบจะได้รับการจัดการอย่างไรในขณะที่ยังคงซิงค์ข้อมูลเมตาอยู่

7. ความสามารถในการรองรับและการบำรุงรักษาผู้จำหน่ายความพร้อมใช้งานมีประสบการณ์เกี่ยวกับความต้องการและการกำหนดค่าความพร้อมใช้งานที่หลากหลายหรือไม่ พวกเขามีอายุยืนยาวหรือไม่และระบบสนับสนุนที่ออกแบบมาเพื่อแก้ไขปัญหาที่อาจนอกเหนือไปจากการแก้ปัญหา สามารถช่วยคุณลดการหยุดชะงักและการหยุดทำงานตามแผนในระหว่างการจัดการระบบและการบำรุงรักษา (แพตช์การอัปเกรดและการบำรุงรักษาทั่วไป)

8. ต้นทุนรวมในการเป็นเจ้าของมีอุตสาหกรรมและบริการทั้งหมดที่ทุ่มเทเพื่อช่วยคุณคำนวณต้นทุนการเป็นเจ้าของทั้งหมดดังนั้นเราจึงไม่ครอบคลุมถึงส่วนนี้ พอจะกล่าวได้ว่าการคำนวณของคุณจะไม่ซ้ำกันสำหรับองค์กรผู้ให้บริการคลาวด์แอปพลิเคชันและทีมไอทีของคุณ คุณควรพิจารณาว่าผู้จำหน่ายโซลูชันความพร้อมใช้งานของคุณสามารถช่วยคุณระบุกลยุทธ์ในการประหยัดการใช้งานการออกใบอนุญาตและค่าใช้จ่ายอื่น ๆ ได้หรือไม่? โซลูชันนี้ทำให้งานด้วยตนเองเป็นอัตโนมัติลดเวลาแรงงานไอทีหรือไม่

9. รูปแบบการออกใบอนุญาตและราคาคุณใช้ต้นทุนของซอฟต์แวร์อย่างไร? มีค่าธรรมเนียมการสมัครสมาชิกรูปแบบการสมัครรับข้อเสนอแบบจ่ายตามการใช้งานนำใบอนุญาตของคุณเอง (BYOL) หรือการรวมกันของตัวเลือกที่ยืดหยุ่น คุณจะเปิดใช้งานการออกใบอนุญาตผลิตภัณฑ์ได้อย่างไร?มีเซิร์ฟเวอร์ใบอนุญาตบริการออกใบอนุญาตหรือคีย์ที่เข้ารหัสตามรายละเอียดการปรับใช้เครื่องเสมือนเช่นที่อยู่ชื่อโฮสต์ที่อยู่ MAC

10. ผลกระทบต่อพนักงานไอทีต้องฝึกอบรมกับโซลูชันมากแค่ไหน? จำเป็นต้องมีการแทรกแซงด้วยตนเองเท่าใดในกรณีที่แอปพลิเคชันล้มเหลวหรือเกิดภัยพิบัติ จะต้องใช้สคริปต์พิเศษที่ต้องดูแลหรือไม่? ใครจะเป็นผู้รับผิดชอบในการบำรุงรักษาอย่างต่อเนื่อง?

ชั่งน้ำหนักผลประโยชน์และการแลกเปลี่ยน

เช่นเดียวกับการตัดสินใจที่สำคัญทุกครั้งคุณต้องเข้าใจการแลกเปลี่ยนและเลือกยอดคงเหลือที่ดีที่สุดเพื่อตอบสนองความต้องการของคุณ ตัวอย่างเช่นฉันเพิ่งขอให้เพื่อนแนะนำรองเท้าเดินที่ดี ฉันซื้อคู่หนึ่งที่เขาพูดถึงโดยสังเกตว่ามันมีน้ำหนักเบาแค่ไหนเนื้อผ้าแข็งแรงและทนทานแค่ไหนและมีสไตล์แค่ไหนฉันไปเดิน – วิ่งระยะไกลเป็นครั้งแรกและได้บริจาครองเท้า“ one run” คู่แรกของฉันทันทีหลังจากนั้น เมื่อฉันไปที่ 'Fleet Feet' เพื่อรับฟังความคิดเห็นของผู้เชี่ยวชาญฉันพบว่ารองเท้าที่หนักกว่าพร้อมด้วยผ้าที่ระบายอากาศได้ดีกว่า (ยังมีความทนทานน้อยกว่า) และความน่าเกลียดที่ไม่มีใครเทียบได้ ฉันทำการแลกเปลี่ยนระหว่างรูปลักษณ์และฟังก์ชันที่เหมาะกับความต้องการและงบประมาณของฉัน

เช่นเดียวกับรองเท้าวิ่งไม่มีโซลูชัน Silver bullet ที่จะเหมาะกับทุก บริษัท ทุกแอปพลิเคชันทุกฐานข้อมูลและทุกเซิร์ฟเวอร์และสถาปัตยกรรมที่เป็นไปได้ คุณมีอิสระที่จะหยุดค้นหาอย่างเป็นทางการ ให้เข้าร่วมกิจกรรมการชั่งน้ำหนักการแลกเปลี่ยนเพื่อพิจารณาว่าอะไรเหมาะสมกับความต้องการของ บริษัท ของคุณ คิดถึงการแลกเปลี่ยนของคุณ ตัวอย่างเช่นหากคุณแน่ใจว่าจะเป็นร้านค้าของ Microsoft อย่างเต็มรูปแบบความสำคัญของการสนับสนุน GCP และ AWS ควรลดลงเล็กน้อยในขั้นตอนการประเมินของคุณ

คำนึงถึงการเปลี่ยนแปลงโครงสร้างพื้นฐานไอทีของคุณ

พิจารณาแบบองค์รวมเกี่ยวกับความพร้อมใช้งานในโครงสร้างพื้นฐานไอทีทั้งหมดของคุณทั้งในองค์กรและในระบบคลาวด์ เหตุผลในการทำเช่นนั้นอธิบายได้ดีที่สุดด้วยการเปรียบเทียบอื่น ๆ ในปี 2018 ฉันเป็นผู้ประสานงานโครงการเผยแพร่ประชาสัมพันธ์ให้อาหารแก่คนไร้บ้านและหิวโหยในโคลัมเบียเซาท์แคโรไลนา กลุ่มของเราพบกันสัปดาห์ละครั้งเพื่อเสิร์ฟอาหารและข้อความแห่งความหวังแก่ชายหญิงและเด็กกว่า 100 คน เมื่อเราพิจารณาขยายเวลาเพิ่มวันในสัปดาห์ชั่วโมงเพิ่มขึ้นหรือบริการเพิ่มเติมเราต้องคิดให้ดีนอกเหนือจากข้อกำหนดการจัดตารางเวลาธรรมดา ๆ เมื่อทราบว่าเรากำลังให้บริการที่สำคัญแก่ลูกค้าที่ต้องพึ่งพาเราเราจึงต้องพิจารณาปัจจัยทั้งหมดที่ส่งผลต่อความสามารถในการให้บริการเหล่านั้นอย่างสม่ำเสมอในระยะยาวเช่นค่าใช้จ่ายอายุของสมาชิกในทีมภาระหน้าที่ภายนอก วิธีการทางเลือกในการบรรลุเป้าหมายปัจจัยเสี่ยงและพลวัตอื่น ๆ ภายในองค์กรแม่ของเรา

เมื่อคุณเลือกโซลูชันของคุณหลังจากที่คุณเข้าใจตลาดทำความคุ้นเคยกับตัวเลือกต่างๆและชั่งน้ำหนักการแลกเปลี่ยนแล้วขั้นตอนสุดท้ายคือการคำนึงถึงพลวัตอื่น ๆ ในสภาพแวดล้อมโดยรวมของคุณ โซลูชันจะตอบสนองความต้องการของธุรกิจโดยรวมหรือไม่? ข้อมูลสำคัญของคุณจะได้รับการปกป้องจากการสูญหายหรือไม่? ผลผลิตของผู้ใช้ปลายทางของคุณจะได้รับการปกป้องจากการหยุดทำงานหรือไม่? จะต้องมีการฝึกอบรมอะไรบ้างในการย้ายไปยังระบบคลาวด์และสิ่งนั้นจะส่งผลต่อความสามารถในการจัดการหรือบำรุงรักษาโซลูชันที่คุณเลือกอย่างไร บทบาทไอทีใดที่จะถูกเพิ่มลบหรือเปลี่ยนแปลงในการเดินทางบนคลาวด์ของคุณความรับผิดชอบสำหรับความพร้อมในการสมัครจะย้ายไปอยู่ที่เจ้าของธุรกิจหรือไม่? และการเปลี่ยนแปลงในความรับผิดชอบหรือทีมจะปรับปรุงหรือลดศักยภาพโดยรวมของคุณในการประสบความสำเร็จได้อย่างไร พิจารณาว่าทีมของคุณจำเป็นต้องดำเนินการทีละขั้นตอนหรือไม่โดยโยกย้ายปริมาณงานที่น้อยลงก่อน

ในฐานะรองประธานฝ่ายประสบการณ์ลูกค้าฉันได้เห็นการวางแผนการย้ายข้อมูลบนคลาวด์ที่หลากหลายซึ่งบางคนก็ตรงไปตรงมาอย่างมาก ในกรณีหนึ่งที่ลูกค้าย้ายไปใช้ระบบคลาวด์เป็นเรื่องที่ถกเถียงกันมากเนื่องจากฝ่ายบริหารเห็นว่าเป็นโอกาสในการกำจัดแผนกไอทีทั้งหมด ฉันไม่ได้แนะนำให้คุณเล่นการเมือง แต่คุณควรตระหนักถึงปัจจัยทั้งหมดที่มีบทบาทในโครงการที่ซับซ้อนเหล่านี้

การย้ายไปยังระบบคลาวด์ควรจะช่วยประหยัดเงินเวลาและทรัพยากรในขณะเดียวกันก็ช่วยปรับปรุงความพร้อมใช้งานและความยืดหยุ่น ไม่ว่าคุณจะเลือกระบบคลาวด์แบบใดให้แน่ใจว่าคุณได้พิจารณาเคล็ดลับเหล่านี้และเลือกโซลูชันความพร้อมใช้งานที่สอดคล้องกันซึ่งให้ความยืดหยุ่นในการมอบการป้องกันที่คุณต้องการในการกำหนดค่าที่คุณต้องการ

เรียนรู้เพิ่มเติมเกี่ยวกับตัวเลือกความพร้อมใช้งานสูงบนคลาวด์ด้วย SIOS

– Cassius Rhue รองประธานฝ่ายประสบการณ์ลูกค้า SIOS

ทำซ้ำโดยได้รับอนุญาตจาก SIOS

วิธีโคลนความพร้อมใช้งานในระบบคลาวด์ด้วยผลลัพธ์ที่ดีขึ้น

ธันวาคม 30, 2020 by Jason Aw Leave a Comment

วิธีการโคลนความพร้อมใช้งานในระบบคลาวด์ด้วยผลลัพธ์ที่ดีกว่า

วิธีโคลนความพร้อมใช้งานในระบบคลาวด์ด้วยผลลัพธ์ที่ดีขึ้น

เคล็ดลับจากภาพยนตร์ – หลายหลาก

Multiplicity เป็นภาพยนตร์ตลกแนววิทยาศาสตร์อเมริกัน ปีพ.ศ. 2539 นำแสดงโดยไมเคิลคีตันขณะที่ดั๊กคินนีย์คนงานก่อสร้างที่วุ่นวายและพยายามหาเวลาให้กับครอบครัวและงานที่ต้องการ เมื่อนักวิทยาศาสตร์เสนอที่จะโคลนเขาดั๊กตกลงที่จะทำตามตารางเวลาและภาระผูกพันของเขาให้ง่ายขึ้น แต่แล้วสำเนาของเขาก็เริ่มทำสำเนาของตัวเอง เมื่อทำสำเนาครั้งสุดท้ายประเด็นจะชัดเจน การโคลนนิ่งอาจไม่ใช่ทั้งหมดที่เกิดขึ้นหรืออย่างน้อยที่สุดก็มาพร้อมกับคำเตือนความท้าทายและผลข้างเคียงที่ชัดเจน Star Trek ตอนดั้งเดิมที่มีชื่อเสียง“ Trouble with Tribbles” แสดงให้เห็นถึงจุดที่คล้ายกัน

เช่นเดียวกับการโคลนบนหน้าจอขนาดใหญ่ (หรือเล็ก) การโคลนนิ่งในระบบคลาวด์เป็นเครื่องมือที่ยอดเยี่ยม แต่ไม่ใช่โดยปราศจากความท้าทาย

เคล็ดลับเพื่อให้ได้ผลลัพธ์ที่ดีขึ้นเมื่อคุณโคลนความพร้อมใช้งานในระบบคลาวด์

1. โคลนระบบปฏิบัติการ

ฟังดูชัดเจน แต่ฉันเห็นว่ามันเกิดขึ้นมากกว่าหนึ่งครั้งในสภาพแวดล้อมองค์กรจริง หากคุณโคลนระบบที่ไม่สามารถใช้งานได้โคลนนั้นจะใช้งานไม่ได้และมีปัญหาอย่างเท่าเทียมกันเมื่อคุณกู้คืน ตรวจสอบให้แน่ใจว่าโคลนที่คุณสร้างนั้นมาจากระบบปฏิบัติการและใช้งานได้จริง

2. ซิงค์ข้อมูลไปยังดิสก์และซิงค์ใหม่ในการกู้คืน

ความสมบูรณ์ของระบบไฟล์เป็นสิ่งสำคัญ หากคุณไม่มั่นใจว่าแอปพลิเคชันและ / หรือ VM ของคุณอยู่ในสถานะที่สอดคล้องกันผู้ขายส่วนใหญ่จะไม่รับประกันว่าจะได้รูปภาพที่สร้างขึ้น เนื่องจากสแน็ปช็อตจะจับเฉพาะข้อมูลที่เขียนลงในโวลุ่มของคุณในขณะที่ออกคำสั่ง snapshot สิ่งนี้อาจไม่รวมข้อมูลใด ๆ ที่ถูกแคชโดยแอปพลิเคชันหรือระบบปฏิบัติการ การตรวจสอบให้แน่ใจว่าข้อมูลได้รับการซิงค์อย่างถูกต้องกับระบบไฟล์เป็นขั้นตอนที่สำคัญและมีความสำคัญอย่างยิ่งในสภาพแวดล้อมคลัสเตอร์

ความสมบูรณ์ของระบบไฟล์ยังเป็นสิ่งสำคัญที่ควรคำนึงถึงเมื่อคุณกู้คืนจากรูปภาพ หากคุณกำลังใช้การจำลองข้อมูลและคุณกู้คืนอิมเมจเป็นซอร์สหรือเป้าหมายในคลัสเตอร์ตรวจสอบให้แน่ใจว่าทั้งสองโหนดซิงค์กันเป็นสิ่งสำคัญยิ่ง หากไม่ทำเช่นนั้นอาจทำให้เกิดข้อผิดพลาดของระบบไฟล์เมื่อเกิดการเฟลโอเวอร์หรือการสลับหรือแม้กระทั่งข้อมูลสูญหาย โคลนความพร้อมใช้งานในระบบคลาวด์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ

3. หยุดอินสแตนซ์ของคุณ

หลายสภาพแวดล้อมไม่ต้องการให้คุณหยุดอินสแตนซ์เพื่อสร้างอิมเมจและบางอย่างเช่น AWS จะทำตามขั้นตอนของการปิดโหนดก่อนทำการคัดลอกอย่างไรก็ตามเครื่องมือและไซต์จำนวนมากแนะนำให้ตรวจสอบว่าแอปพลิเคชันหยุดทำงานและมีการซิงค์การเข้าถึงระบบไฟล์อย่างเหมาะสมเพื่อหลีกเลี่ยงความเสียหายการสูญเสียความสมบูรณ์หรือการสร้างภาพที่มีปัญหาในการเริ่มต้นหยุดหรือเรียกใช้แอปพลิเคชันที่ติดตั้ง

4. ติดป้ายกำกับทุกอย่างในระบบคลาวด์ (โหนดดิสก์ NIC ทุกอย่าง)

ในขณะที่การสร้างโคลนเป็นการดำเนินการที่ไม่เสียค่าใช้จ่าย แต่โดยทั่วไปแล้วดิสก์และส่วนประกอบที่เป็นผลลัพธ์จะไม่ได้ตัวอย่างเช่น AWS ระบุว่าคุณ“ ถูกเรียกเก็บเงินสำหรับสแนปชอตจนกว่าคุณจะยกเลิกการลงทะเบียนรูปภาพและลบสแนปชอต” เมื่อสิ่งต่างๆไม่ได้ติดป้ายกำกับการรู้ว่าอะไรถูกใช้งานหรือไม่ได้ใช้งานและสาเหตุที่สร้างขึ้นอาจกลายเป็นปัญหาได้ นอกจากนี้ยังต้องอยู่ภายใต้ความทรงจำที่หายวับไปหรือสมาธิที่ไม่ดีของสมาชิกในทีมที่มีอยู่ติดป้ายกำกับทุกอย่าง

5. ลูกพรุนโคลนและสแนปช็อตบ่อยๆ (ประหยัดค่าใช้จ่ายและลดอาการปวดหัว)

การตัดแต่งสแน็ปช็อตและโคลนนิ่งเก่าไม่เพียง แต่จะช่วยประหยัดค่าใช้จ่าย แต่ยังช่วยลดอาการปวดหัวได้อีกด้วยสแน็ปช็อตที่เก่ากว่าเสี่ยงต่อการแนะนำช่องโหว่ที่ได้รับการแก้ไขหรือแก้ไขในสำเนาที่ใหม่กว่าในฐานะรองประธานฝ่ายประสบการณ์ลูกค้าของ SIOS Technology Corp. ฉันเห็นผลลัพธ์โดยตรงเมื่อเราทำงานกับลูกค้าที่กู้คืนจากสแนปชอต พวกเขาพบปัญหาหลายประการเมื่อรีสตาร์ทแอปพลิเคชัน หลังจากแก้ไขปัญหาเราพบว่าโคลนกำลังใช้งานซอฟต์แวร์รักษาความปลอดภัยเวอร์ชันเก่า ข้อมูลรับรองและข้อมูลเมตาที่เก็บไว้ในโปรไฟล์ผู้ใช้จะไม่ซิงค์กับข้อมูลแอปพลิเคชันจริงที่เก็บไว้ในไดรฟ์ข้อมูลที่ติดตั้งภายนอกอีกต่อไป

6. จำกัด หรือ จำกัด การโคลนโคลนในระบบคลาวด์

สุดท้ายนี้ไม่ใช่ทุกสิ่งที่คุณทำในระบบคลาวด์จะต้องถูกโคลน พิจารณา จำกัด ประเภทของเวิร์กโหลดที่คุณจะโคลนและ จำกัด จำนวนหรือบทบาทที่สามารถสร้างโคลนในสภาพแวดล้อมของคุณ

ในภาพยนตร์เมื่อโคลนของ Doug ได้จุดประกายชุดการทำสำเนาของตัวเอง Doug (Michael Keaton) ที่ถูกครอบงำแล้วถูกบังคับให้ต้องออกแรงมากขึ้นเพื่อจัดการกับโคลนจำนวนมากของเขาในขณะที่พยายามซ่อนความยุ่งเหยิงที่เขาสร้างขึ้นจากภรรยาของเขา การบรรลุความพร้อมใช้งานของการโคลนในระบบคลาวด์ด้วยผลลัพธ์ที่ดีกว่าไม่ใช่เรื่องยาก โคลนอย่างระมัดระวังเพื่อหลีกเลี่ยงการทำงานมากขึ้นและเพิ่มความเสี่ยงจากเครื่องมือที่ควรจะทำให้งานของคุณง่ายขึ้นและสภาพแวดล้อมของคุณปลอดภัยยิ่งขึ้น

– Cassius Rhue รองประธานฝ่ายประสบการณ์ลูกค้า

ผลิตซ้ำจาก SIOS