กุมภาพันธ์ 14, 2021 |
เกี่ยวกับการใช้ Amazon FSX สำหรับ SQL Server Failover Cluster Instanceการใช้ Amazon FSX สำหรับอินสแตนซ์คลัสเตอร์ล้มเหลวของเซิร์ฟเวอร์ SQL – สิ่งที่คุณต้องรู้!หากคุณกำลังพิจารณาปรับใช้อินสแตนซ์ Microsoft SQL Server ของคุณเองใน AWS EC2 คุณมีการตัดสินใจบางอย่างเกี่ยวกับความยืดหยุ่นของโซลูชัน แน่นอนว่า AWS จะเสนอ SLA 99.99% ให้กับทรัพยากรการประมวลผลของคุณหากคุณปรับใช้สองอินสแตนซ์ขึ้นไปในโซนความพร้อมใช้งานที่แตกต่างกัน แต่อย่าเพิ่งหลงเชื่อมีปัจจัยอื่น ๆ อีกมากมายที่คุณต้องพิจารณาเมื่อคำนวณความพร้อมใช้งานของแอปพลิเคชันที่แท้จริง ฉันเพิ่งเขียนบล็อกเกี่ยวกับวิธีคำนวณความพร้อมใช้งานแอปพลิเคชันของคุณในระบบคลาวด์ คุณควรอ่านบทความนั้นอย่างรวดเร็วก่อนที่จะดำเนินการต่อ เมื่อพูดถึงการตรวจสอบให้แน่ใจว่าอินสแตนซ์ Microsoft SQL Server ของคุณพร้อมใช้งานสูงจริงๆแล้วจะมีตัวเลือกพื้นฐานสองตัวเลือก: Always On Availability Group (AG) หรือ SQL Server Failover Cluster Instance (FCI) หากคุณกำลังอ่านบทความนี้ฉันตั้งสมมติฐานว่าคุณทราบดีถึงตัวเลือกทั้งสองนี้และกำลังพิจารณาอย่างจริงจังที่จะใช้อินสแตนซ์คลัสเตอร์ล้มเหลวของเซิร์ฟเวอร์ SQL แทน SQL Server Always On AG ประโยชน์ของอินสแตนซ์คลัสเตอร์ล้มเหลวของเซิร์ฟเวอร์ SQL ของ Microsoftรายการต่อไปนี้สรุปสิ่งที่ AWS กล่าวว่าเป็นประโยชน์ของ SQL Server FCI: โดยทั่วไปแล้ว FCI เป็นที่ต้องการมากกว่า AG สำหรับการปรับใช้ SQL Server ที่มีความพร้อมใช้งานสูงเมื่อสิ่งต่อไปนี้เป็นข้อกังวลลำดับความสำคัญสำหรับกรณีการใช้งานของคุณ: การป้องกันระดับอินสแตนซ์เทียบกับการป้องกันระดับฐานข้อมูล: ด้วย FCI อินสแตนซ์ทั้งหมดจะได้รับการป้องกัน – หากโหนดหลักไม่พร้อมใช้งานอินสแตนซ์ทั้งหมดจะถูกย้ายไปยังโหนดสแตนด์บาย สิ่งนี้จะดูแลการล็อกอินของ SQL Server งาน SQL Server Agent ใบรับรอง ฯลฯ ที่เก็บไว้ในฐานข้อมูลระบบซึ่งจัดเก็บทางกายภาพในที่เก็บข้อมูลแบบแบ่งใช้ ในทางกลับกันด้วย AG ในทางกลับกันเฉพาะฐานข้อมูลในกลุ่มเท่านั้นที่ได้รับการปกป้องและไม่สามารถเพิ่มฐานข้อมูลระบบลงใน AG ได้ – อนุญาตให้ใช้เฉพาะฐานข้อมูลผู้ใช้เท่านั้น เป็นความรับผิดชอบของผู้ดูแลระบบฐานข้อมูลในการทำซ้ำการเปลี่ยนแปลงอ็อบเจ็กต์ระบบในการจำลอง AG ทั้งหมด สิ่งนี้ทำให้ความเป็นไปได้ที่จะเกิดข้อผิดพลาดของมนุษย์ซึ่งทำให้ฐานข้อมูลไม่สามารถเข้าถึงแอปพลิเคชันได้ การสนับสนุนคุณลักษณะ DTC: หากคุณใช้ SQL Server 2012 หรือ 2014 และแอปพลิเคชันของคุณใช้ Distributed Transaction Coordinator (DTC) คุณจะไม่สามารถใช้ AG ได้เนื่องจากไม่ได้รับการสนับสนุน ใช้ FCI ในสถานการณ์นี้ ความท้าทายกับ FCI ในคลาวด์แน่นอน. ความท้าทายในการสร้าง FCI ที่ครอบคลุมโซนความพร้อมใช้งานคือการขาดอุปกรณ์จัดเก็บข้อมูลที่ใช้ร่วมกันซึ่งโดยปกติจำเป็นต้องใช้ เนื่องจากโหนดของคลัสเตอร์ถูกกระจายไปตามศูนย์ข้อมูลหลายแห่ง SAN แบบดั้งเดิมจึงไม่ใช่ตัวเลือกที่ใช้ได้สำหรับพื้นที่เก็บข้อมูลที่ใช้ร่วมกัน นั่นทำให้เรามีทางเลือกสองทางสำหรับการจัดเก็บคลัสเตอร์: ทรัพยากรระดับพื้นที่เก็บข้อมูลของบุคคลที่สามเช่น SIOS DataKeeper หรือ Amazon FSx ใหม่ มาดูสิ่งที่คุณต้องรู้ก่อนตัดสินใจเลือกข้อตกลงระดับการให้บริการตามที่ฉันเขียนไว้ในวิธีคำนวณความพร้อมใช้งานแอปพลิเคชันของคุณ SLA แอปพลิเคชันโดยรวมของคุณนั้นดีพอ ๆ กับลิงก์ที่อ่อนแอที่สุดของคุณ ในกรณีนี้ FSx SLA 99.9% โดยปกติความพร้อมใช้งาน 99.99% หมายถึงจุดเริ่มต้นของสิ่งที่ถือว่า "พร้อมใช้งานสูง" นี่คือสิ่งที่ AWS สัญญากับคุณสำหรับทรัพยากรการประมวลผลของคุณเมื่อมีการปรับใช้สองรายการขึ้นไปในโซนความพร้อมใช้งานที่แตกต่างกัน ในกรณีที่คุณไม่ทราบความแตกต่างระหว่างสามเก้ากับสี่เก้า …
ด้วยการโฮสต์พื้นที่จัดเก็บคลัสเตอร์ของคุณบน FSx แม้ว่าคุณจะมีความพร้อมในการประมวลผล 99.99% ความพร้อมใช้งานแอปพลิเคชันโดยรวมของคุณจะเป็น 99.9% ในทางตรงกันข้ามไดรฟ์ข้อมูล EBS ที่ครอบคลุมโซนความพร้อมใช้งานเช่นในการปรับใช้ DataKeeper จะมีคุณสมบัติสำหรับ SLA 99.99% ทั้งในชั้นพื้นที่จัดเก็บข้อมูลและการประมวลผล ซึ่งหมายความว่าความพร้อมใช้งานโดยรวมของคุณคือ 99.99% สถานที่จัดเก็บเมื่อกำหนดค่า FSx เพื่อความพร้อมใช้งานสูงคุณจะต้องเปิดใช้งานการสนับสนุนหลาย AZ การเปิดใช้งานหลาย AZ จะทำให้คุณมี AZ ที่ "ต้องการ" และ AZ "สแตนด์บาย" ได้อย่างมีประสิทธิภาพ เมื่อคุณปรับใช้โหนด SQL Server FCI ของคุณคุณจะต้องการกระจายโหนดเหล่านั้นใน AZ เดียวกัน ในสถานการณ์ปกติคุณจะต้องตรวจสอบให้แน่ใจว่าโหนดคลัสเตอร์ที่ใช้งานอยู่อยู่ใน AZ เดียวกับโหนดหน่วยเก็บข้อมูล FSx ที่ต้องการ นี่คือการลดระยะทางและเวลาแฝงในการจัดเก็บข้อมูลของคุณ แต่ยังช่วยลดค่าใช้จ่ายที่เกี่ยวข้องกับการถ่ายโอนข้อมูลข้าม AZ ด้วย ตามที่ระบุไว้ในคู่มือราคา FSx“ ค่าธรรมเนียมการถ่ายโอนข้อมูลมาตรฐานใช้สำหรับการเข้าถึงระบบไฟล์ระหว่าง AZ หรือระหว่างภูมิภาค” ในสถานการณ์ที่โชคร้ายที่คุณมีความล้มเหลวของ SQL Server FCI แต่ไม่ใช่ความล้มเหลว FSx ไม่มีกลไกใดที่จะผูกทั้งพื้นที่จัดเก็บและคำนวณเข้าด้วยกัน ในกรณีที่ FSx ล้มเหลวจะกลับไปที่โซนความพร้อมใช้งานหลักโดยอัตโนมัติ อย่างไรก็ตามแนวทางปฏิบัติที่ดีที่สุดกำหนดให้ SQL FCI ยังคงทำงานบนโหนดรองจนกว่าจะมีการวิเคราะห์สาเหตุรากและโดยทั่วไปแล้วการล้มเหลวจะถูกกำหนดให้เกิดขึ้นในช่วงระยะเวลาการบำรุงรักษา ซึ่งจะทำให้คุณตกอยู่ในสถานการณ์ที่พื้นที่เก็บข้อมูลของคุณอยู่ใน AZ อื่นซึ่งจะต้องเสียค่าใช้จ่ายเพิ่มเติม ปัจจุบันค่าใช้จ่ายในการถ่ายโอนข้อมูลข้าม AZ ทั้งขาเข้าและขาออกคือ 0.01 ดอลลาร์ / GB หากไม่จับตาดูสถานะ FSx และ SQL Server FCI ของคุณอย่างใกล้ชิดคุณอาจไม่รู้ด้วยซ้ำว่ากำลังทำงานอยู่ในภูมิภาคต่างๆจนกว่าคุณจะเห็นค่าธรรมเนียมการถ่ายโอนข้อมูลเมื่อสิ้นเดือน ในทางตรงกันข้ามในคอนฟิกูเรชันที่ใช้ SIOS DataKeeper การล้มเหลวของหน่วยเก็บข้อมูลเป็นส่วนหนึ่งของการกู้คืน SQL Server FCI เพื่อให้แน่ใจว่าที่เก็บข้อมูลมักจะล้มเหลวด้วยอินสแตนซ์ SQL Server สิ่งนี้ทำให้มั่นใจได้ว่า SQL Server จะอ่านและเขียนไปยังไดรฟ์ข้อมูล EBS ที่เชื่อมต่อโดยตรงกับโหนดที่ใช้งานอยู่ โปรดทราบว่า DataKeeper จะต้องเสียค่าใช้จ่ายในการถ่ายโอนข้อมูลที่เกี่ยวข้องกับการดำเนินการเขียนซึ่งจำลองแบบระหว่าง AZ หรือภูมิภาค ต้นทุนการถ่ายโอนข้อมูลนี้สามารถลดลงได้ด้วยการใช้การบีบอัดที่มีอยู่ใน DataKeeper การควบคุมล้มเหลวในคอนฟิกูเรชันหลายซับเน็ต FSx มีโซนความพร้อมใช้งานที่ต้องการและความพร้อมใช้งานสแตนด์บาย หากไฟล์เซิร์ฟเวอร์ FSx ในโซนความพร้อมใช้งานที่ต้องการประสบกับความล้มเหลวเซิร์ฟเวอร์ไฟล์ใน AZ สแตนด์บายจะกู้คืน AWS รายงานว่าเวลาในการกู้คืนนี้ใช้เวลาประมาณ 30 วินาทีกับการแชร์มาตรฐาน ด้วยการใช้การแชร์ไฟล์ที่มีอยู่อย่างต่อเนื่อง Microsoft รายงานว่าเวลาเฟลโอเวอร์นี้อาจใกล้ถึง 15 วินาที ในช่วงเวลาล้มเหลวนี้จะมีไฟดับที่เกิดขึ้นเมื่อการอ่านและการเขียนหยุดชั่วคราว แต่จะดำเนินต่อไปเมื่อการกู้คืนเสร็จสมบูรณ์ FSx หลายไซต์เปิดใช้งานข้อผิดพลาดอัตโนมัติ ซึ่งหมายความว่าสำหรับ FSx ที่ไม่ได้วางแผนไว้ทุกครั้งคุณจะมีข้อผิดพลาดที่ไม่ได้วางแผนไว้ด้วย ในทางตรงกันข้ามโดยทั่วไปเมื่อ SQL Server FCI ประสบกับความล้มเหลวที่ไม่ได้วางแผนไว้คุณอาจจะปล่อยให้มันทำงานในลำดับรองหรือกำหนดเวลาการล้มเหลวหลังจากชั่วโมงหรือในช่วงการบำรุงรักษาถัดไป บริการวิเคราะห์เซิร์ฟเวอร์ SQL คลัสเตอร์ไม่รองรับ FSXหากคุณต้องการคลัสเตอร์ SSAS คุณจะต้องมีทรัพยากรดิสก์แบบคลัสเตอร์เช่น SIOS DataKeeper เอกสารไวท์เปเปอร์ How to Cluster SQL Server Analysis Server ระบุอย่างชัดเจนว่าไม่สามารถใช้ SMB ได้และต้องใช้คลัสเตอร์ไดรฟ์ที่มีอักษรระบุไดรฟ์ ในทางตรงกันข้ามทรัพยากร DataKeeper Volume จะแสดงตัวเองเป็นดิสก์คลัสเตอร์และสามารถใช้กับ SSAS ได้ สรุปแม้ว่า FSx จะเหมาะสมกับการใช้งาน SMB ทั่วไปเช่นไฟล์ผู้ใช้ Windows และบริการอื่น ๆ ที่ไม่สำคัญซึ่ง SLA ความพร้อมใช้งาน 99.9% เพียงพอ แต่ FSx เป็นตัวเลือกที่ยอดเยี่ยมหากแอปพลิเคชันของคุณต้องการความพร้อมใช้งานสูง (99.99%) หรือโซลูชัน HA / DR ที่ครอบคลุม ภูมิภาค SIOS DataKeeper คือขนาดที่เหมาะสม ทำซ้ำโดยได้รับอนุญาตจาก Clusteringformeremortals
|
|||||||||||||||||
กุมภาพันธ์ 6, 2021 |
SIOS Protection Suite สำหรับ Linux Quick Service Protectionการใช้ SIOS Protection Suite สำหรับ Linux Quick Service Protection Resourceในการมีส่วนร่วมกับทีม SIOS Professional Services เมื่อเร็ว ๆ นี้ลูกค้าได้สอบถามเกี่ยวกับวิธีป้องกันแอปพลิเคชันที่กำหนดเองด้วยโซลูชัน SIOS Protection Suite สำหรับ Linux หนึ่งในผู้เชี่ยวชาญด้านความพร้อมใช้งานที่มีประสบการณ์สูงที่ SIOS Technology Corp. ได้ช่วยทำความเข้าใจแอปพลิเคชันของลูกค้าและกำหนดวิธีการที่ SIOS มีให้สำหรับการสนับสนุนแอปพลิเคชันที่กำหนดเอง SIOS Protection Suite สำหรับ Linux มีหลายวิธีในการเพิ่มความพร้อมใช้งานสูงและการตรวจสอบแอปพลิเคชันให้กับแอปพลิเคชันแบบกำหนดเองตัวเลือกเหล่านี้มีดังต่อไปนี้:
คำจำกัดความที่ใช้ในแผนภูมิ การตรวจสอบ – หมายถึงความสามารถในการกำหนดความพร้อมการเข้าถึงและการทำงานของแอปพลิเคชันฐานข้อมูลหรือบริการที่ได้รับการป้องกันการตรวจสอบแอปพลิเคชันฐานข้อมูลหรือบริการในระดับต่ำให้ความครอบคลุมพื้นฐานเช่นการตรวจสอบกระบวนการที่กำลังทำงานอยู่การมีอยู่ของ pid_file หรือคำสั่งสถานะจะส่งคืนผลลัพธ์เป็น "จริง" เมื่อดำเนินการหมายเหตุ: โค้ดส่งคืน "จริง" หรือ "0 (ศูนย์)" ไม่ได้หมายความว่าแอปพลิเคชันฐานข้อมูลหรือบริการกำลังทำงานอยู่ แต่มีเพียงคำสั่งที่ดำเนินการเท่านั้นที่สามารถดำเนินการได้สำเร็จด้วยผลลัพธ์สถานะบวก ("จริง" หรือ "0 (ศูนย์)")ระดับสูงสุดของการตรวจสอบบ่งชี้ว่าความรู้เฉพาะของแอปพลิเคชันถูกนำไปใช้เพื่อกำหนดความสมบูรณ์และการทำงานของแอปพลิเคชันนอกเหนือจากวิธีการระดับล่างเช่นสถานะของกระบวนการเอาต์พุต ps หรือการคืนสถานะ systemdระดับสูงสุดของการเฝ้าติดตามโดยทั่วไปจะใช้ความรู้เกี่ยวกับลำดับการดำเนินการตรวจสุขภาพที่แนะนำความรู้เกี่ยวกับการพึ่งพาและการวิเคราะห์ผลลัพธ์ที่ได้รับจากสถานะและคำสั่งการตรวจสอบ การกู้คืน – หมายถึงความสามารถในการรีสตาร์ทแอปพลิเคชันฐานข้อมูลหรือบริการที่ล้มเหลวความสามารถในการกู้คืนในระดับต่ำหมายความว่ามีการออกคำสั่งสำหรับการรีสตาร์ทและผลลัพธ์ที่คาดหวังจะได้รับจากการออกคำสั่งระดับสูงสุดของการตรวจสอบบ่งชี้ว่าความรู้เฉพาะแอปพลิเคชันถูกนำไปใช้เพื่อกำหนดวิธีการเริ่มการรีสตาร์ทแอปพลิเคชันฐานข้อมูลหรือบริการตามลำดับซึ่งอาจต้องใช้ความรู้เกี่ยวกับลำดับการดำเนินการที่แนะนำการอ้างอิงการย้อนกลับหรือการแก้ไขอื่น ๆ ที่เกี่ยวข้องของความล้มเหลว บริการ. วิธีแก้ไข: ทรัพยากรการป้องกันบริการด่วนในการมีส่วนร่วมนี้แอปพลิเคชันของลูกค้ามีความเข้ากันได้ของระบบ จากข้อกำหนดโดยรวมในการหลีกเลี่ยงการเข้ารหัสความต้องการการตรวจสอบขั้นต่ำและขั้นตอนการกู้คืนอย่างง่ายเราขอแนะนำทรัพยากร Quick Service Protection (QSP) ทรัพยากร QSP ทำงานเพื่อเพิ่มการสนับสนุนของบริการ systemd ไปยัง SIOS Protection Suite สำหรับการปกป้องทรัพยากร Linux อย่างรวดเร็วในกรณีของ Customer Example.com พวกเขามีบริการที่เข้ากันได้กับ systemd โดยมีข้อกำหนดขั้นต่ำที่จำเป็นในการเริ่มและหยุดแอปพลิเคชัน
ไฟล์ Example.com systemd SIOS ขอแนะนำว่าก่อนที่จะพยายามป้องกันทรัพยากรด้วยผลิตภัณฑ์ SIOS Protection Suite สำหรับ Linux ให้ตรวจสอบผ่าน systemctl ว่าแอปพลิเคชันตัวอย่างหยุดทำงานและเริ่มทำงานตามนั้น: # systemctl ตัวอย่างสถานะ * example.service – SIOS "ตามสภาพ" บริการตัวอย่างปี 2020 โหลดแล้ว: โหลดแล้ว (/usr/lib/systemd/system/example.service; ปิดใช้งานพรีเซ็ตผู้ขาย: ปิดใช้งาน) ใช้งาน: ไม่ใช้งาน (ตาย) # systemctl start ตัวอย่าง โหลดแล้ว: โหลดแล้ว (/usr/lib/systemd/system/example.service; ปิดใช้งานพรีเซ็ตผู้ขาย: ปิดใช้งาน) ใช้งาน: ใช้งานอยู่ (ทำงาน) ตั้งแต่ศ. 2020-08-21 14:53:27 EDT; 5 วินาทีที่ผ่านมา PID หลัก: 19937 (exampleapp) กลุ่ม CG: /system.slice/example.service `-19937 / usr / bin / perl / example_app / bin / exampleapp เริ่มต้น # systemctl stop ตัวอย่าง # systemctl ตัวอย่างสถานะ * example.service – SIOS "ตามสภาพ" บริการตัวอย่างปี 2020 โหลดแล้ว: โหลดแล้ว (/usr/lib/systemd/system/example.service; ปิดใช้งานพรีเซ็ตผู้ขาย: ปิดใช้งาน) ใช้งานอยู่: ไม่ใช้งาน (ตาย) หลังจากตรวจสอบว่าแอปพลิเคชันทำงานอย่างถูกต้องผ่าน systemd ให้เริ่มบริการใหม่และตรวจสอบให้แน่ใจว่าบริการกำลังทำงานอยู่ # systemctl start ตัวอย่าง # systemctl ตัวอย่างสถานะ * example.service – SIOS "ตามสภาพ" บริการตัวอย่างปี 2020 โหลดแล้ว: โหลดแล้ว (/usr/lib/systemd/system/example.service; ปิดใช้งานพรีเซ็ตผู้ขาย: ปิดใช้งาน) ใช้งาน: ใช้งานอยู่ (ทำงาน) ตั้งแต่ศ. 2020-08-21 15:59:44 EDT; 3 นาที 2 วินาทีที่แล้ว PID หลัก: 30740 (exampleapp) โปรดดูเอกสารประกอบ SIOS Protection Suite สำหรับ Linux Quick Service Protection Suite สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับกระบวนการสร้างทรัพยากร การใช้ SPS-L UI เลือกตัวเลือกสร้างที่ระบุใน Global UI Resource Toolbar โดยไอคอนต่อไปนี้: เมื่อ ใน หลังจากเลือก "Switchback Type" กล่องโต้ตอบเซิร์ฟเวอร์จะปรากฏขึ้นเพื่อให้คุณสามารถเลือกเซิร์ฟเวอร์หลักสำหรับแอปพลิเคชันที่กำหนดเองได้ (หมายเหตุ: หากบริการต้องการพื้นที่จัดเก็บโปรดเลือกเซิร์ฟเวอร์หลักเดียวกันกับที่เลือกไว้ก่อนหน้านี้สำหรับทรัพยากรหน่วยเก็บข้อมูล) ในกล่องโต้ตอบชื่อบริการค้นหาบริการสำหรับแอปพลิเคชันแบบกำหนดเองของคุณ เมื่อคุณเลือกบริการที่ถูกต้องแล้วตัวอย่างเช่นกำหนดว่าคุณจะเปิดใช้งานการตรวจสอบหรือปิดใช้งานบริการตรวจสอบโปรดดูเอกสารประกอบเพื่อทำความเข้าใจเกี่ยวกับการมอนิเตอร์ที่จัดเตรียมโดยทรัพยากร QSP 2 จากนั้นเลือกแท็กทรัพยากรแท็กทรัพยากรควรเป็นชื่อที่มีความหมายซึ่งจะช่วยให้ทีมไอทีของคุณระบุได้อย่างรวดเร็วว่าทรัพยากร SPS-L ใดที่ปกป้องแอปพลิเคชันหรือบริการของคุณ สุดท้ายให้ทำตามบทสนทนาสุดท้ายเพื่อเสร็จสิ้นกระบวนการสร้างทรัพยากรเมื่อสร้างทรัพยากรแล้วให้ใช้ UI เพื่อขยายทรัพยากรไปยังเซิร์ฟเวอร์เพิ่มเติม หากจำเป็นให้สร้างการอ้างอิงระหว่างบริการ / แอปพลิเคชันที่กำหนดเองที่ได้รับการป้องกันใหม่และทรัพยากรที่จำเป็นอื่น ๆ เช่นที่เก็บข้อมูลหรือทรัพยากร IP หมายเหตุ: 1 การสร้างชุดการกู้คืนแอปพลิเคชันของลูกค้าสามารถทำได้โดยการมีส่วนร่วมกับทีมบริการระดับมืออาชีพของ SIOS Technology Corp.สำหรับข้อมูลเพิ่มเติมโปรดติดต่อ professional-services@us.sios.com ผลิตซ้ำจาก SIOS |
|||||||||||||||||
มกราคม 29, 2021 |
วิธีทำความเข้าใจและตอบสนองต่อการแจ้งเตือนความพร้อมใช้งานฮูสตันเรามีปัญหา (หรือวิธีทำความเข้าใจและตอบสนองต่อการแจ้งเตือนความพร้อมใช้งาน) |
|||||||||||||||||
มกราคม 23, 2021 |
ฉันต้องการซอฟต์แวร์ความพร้อมใช้งานสูงในระบบคลาวด์หรือไม่? |
|||||||||||||||||
มกราคม 16, 2021 |
ฉันควรใช้ Zabbix ใน AWS หรือไม่ฉันควรใช้ Zabbix ใน AWS หรือไม่การตรวจสอบ Amazon EC2Zabbix มีส่วนแบ่งการตลาดสูงในฐานะเครื่องมือตรวจสอบ OSS ในตัวแม้ว่าจะมีการใช้กันอย่างแพร่หลายในสภาพแวดล้อมภายในองค์กร แต่ก็มีตัวอย่างมากมายของ Zabbix ที่ใช้ในสภาพแวดล้อม AWSแม้ว่า AWS จะมีบริการตรวจสอบเช่น Amazon CloudWatch ด้วยเหตุใดคุณจึงควรใช้ Zabbixส่วนนี้อธิบายถึงประโยชน์ของการมอนิเตอร์อินสแตนซ์ EC2 และอินสแตนซ์อื่น ๆ ตลอดจนกระบวนการกำหนดค่า เหตุใดจึงต้องใช้ Zabbix แทน Amazon CloudWatchในสภาพแวดล้อม AWS โครงสร้างพื้นฐานทั้งหมดจะดำเนินการโดย AWS แต่คุณต้องรับผิดชอบต่อการทำงานของอินสแตนซ์ Amazon EC2 ด้วยตนเองและแอปพลิเคชันที่สร้างบน Amazon EC2 กล่าวอีกนัยหนึ่งคุณต้องตรวจสอบแอปพลิเคชันเพื่อให้แน่ใจว่าแอปพลิเคชันทำงานได้อย่างถูกต้องและคุณต้องดำเนินการเมื่อเกิดปัญหาขึ้นZabbix เป็นตัวเลือกที่ดีสำหรับเครื่องมือตรวจสอบประเภทนี้ Zabbix มีข้อได้เปรียบในการตรวจสอบไม่เพียง แต่ในสถานที่ แต่ยังรวมถึงสภาพแวดล้อมระบบคลาวด์และเสมือนในลักษณะบูรณาการ ในขณะที่มาตรฐาน Amazon CloudWatch จำกัด เฉพาะการตรวจสอบทรัพยากร AWS (CPU หน่วยความจำ ฯลฯ ) Zabbix ช่วยให้คุณสามารถตรวจสอบสถานะของแอปพลิเคชันของคุณได้อย่างละเอียด ต่อไปนี้เป็นรายการข้อดีอื่น ๆ ของ Zabbixการตรวจสอบสภาพแวดล้อมแบบบูรณาการกับบัญชี AWS หลายบัญชีAmazon CloudWatch ทำการตรวจสอบตามบัญชี AWSZabbix สามารถตรวจสอบสภาพแวดล้อมของบัญชี AWS หลายบัญชีซึ่งสามารถตรวจสอบระบบธุรกิจที่ประกอบด้วยหลายบัญชีนอกจากนี้ยังสามารถตรวจจับความผิดปกติไม่เพียง แต่โดยการแจ้งเตือนธรรมดาตามเกณฑ์เท่านั้น แต่ยังรวมถึงเกณฑ์และเงื่อนไขหลายรายการร่วมกัน สามารถกำหนดค่าด้วยการแจ้งเตือนโดยละเอียดเพื่อให้เหมาะกับสภาพการทำงานจริงAmazon CloudWatch สามารถแจ้งเตือนคุณด้วยข้อความในกรณีที่เกิดความผิดปกติตัวอย่างเช่นหากระบบของคุณหยุดการบำรุงรักษาคุณไม่จำเป็นต้องได้รับการแจ้งเตือนทางข้อความนี่คือจุดที่ Zabbix อนุญาตให้คุณกำหนดค่ากรณีเหล่านี้ในลักษณะที่ช่วยให้คุณสามารถระงับข้อความที่ไม่ต้องการวิธีนี้จะช่วยให้มั่นใจได้ว่าคุณจะได้รับการแจ้งเตือนเมื่อมีสิ่งผิดปกติที่จำเป็นต้องได้รับการแก้ไขเท่านั้น ไม่มีระยะเวลาการเก็บรักษาสำหรับเมตริก (บันทึกการตรวจสอบ)ด้วย Amazon CloudWatch สามารถจัดเก็บเมตริกได้นานถึง 15 เดือนยิ่งไปกว่านั้นคุณสามารถจัดเก็บเมตริกได้ทีละชั่วโมงเป็นเวลา 15 เดือนและหากกำหนดช่วงเวลาการตรวจสอบไว้น้อยกว่า 60 วินาทีคุณจะจัดเก็บได้สูงสุด 3 ชั่วโมงเท่านั้นZabbix ช่วยให้สามารถจัดเก็บเมตริกได้ในระยะยาวโดยไม่ต้องเปลี่ยนรายละเอียดของข้อมูล วิธีตรวจสอบสภาพแวดล้อม AWS ด้วย Zabbixหากคุณต้องการใช้ Zabbix ใน AWS คุณจะต้องสร้างอินสแตนซ์ Amazon EC2 และ DB และติดตั้ง Zabbixหลังการติดตั้งขั้นตอนการกำหนดค่า Zabbix จะเหมือนกับในองค์กรยกเว้นว่าคุณจะต้องตั้งค่าสิ่งต่อไปนี้
นอกจากนี้คุณสามารถกำหนดการตั้งค่าเฉพาะ AWS ได้เช่นการสร้างผู้ใช้ใน AWS IAM ด้วยสิทธิ์ที่จำเป็นสำหรับ Zabbix ซึ่งจะช่วยให้ Zabbix ตรวจสอบแอปพลิเคชันและสภาพแวดล้อม AWS ในแง่มุมอื่น ๆ ใช้เครื่องมือที่เหมาะสมกับความต้องการในการตรวจสอบของคุณระบบขององค์กรบางระบบไม่ได้ดำเนินการแยกกัน แต่มีการเชื่อมโยงระบบหลายระบบเข้าด้วยกันเพื่อแลกเปลี่ยนข้อมูลและรับรองความสอดคล้องกันในสภาพแวดล้อมเหล่านี้ Zabbix เป็นเครื่องมือที่ยอดเยี่ยมสำหรับการตรวจสอบและตรวจจับความผิดปกติในเซิร์ฟเวอร์และระบบต่างๆตัวอย่างเช่นหากเว็บแอปพลิเคชันที่ใช้ฐานข้อมูลมีความผิดปกติบนเว็บแอ็พพลิเคชันเซิร์ฟเวอร์ก็สามารถปิดใช้งานข้อมูลได้เช่น ในทางกลับกัน Zabbix มีตัวเลือกการกำหนดค่ามากมายดังนั้นคุณจะต้องตัดสินใจว่าจะตรวจสอบอะไรอย่างไรและเงื่อนไขใดที่ผิดปกติ ในทางกลับกัน Zabbix มีการตั้งค่ามากมายดังนั้นคุณต้องออกแบบการทำงานให้ชัดเจนว่าจะตรวจสอบอะไรและจะทำอย่างไรกับมันและจะทำอย่างไรกับมัน แน่นอนว่าสำหรับระบบที่สำคัญการออกแบบนั้นเป็นสิ่งสำคัญอย่างไรก็ตามสำหรับระบบที่ค่อนข้างเรียบง่ายเช่น“ ถ้ากระบวนการหยุดเพียงแค่เริ่มต้นใหม่” จะไม่มีการตรวจสอบ Zabbix ที่ตรงกันSIOS AppKeeper เป็นทางออกที่ดีสำหรับกรณีดังกล่าวเนื่องจากตรวจสอบบริการ (กระบวนการ) ของแอปพลิเคชันที่ทำงานบนอินสแตนซ์ EC2 และรีสตาร์ทแอปพลิเคชันหากตรวจพบปัญหา ทำให้สามารถตรวจสอบและใช้งานได้ง่าย แน่นอนว่าการใช้ Zabbix ในทุกระบบนั้นไม่ "บังคับ"ด้วยการใช้เครื่องมือที่เหมาะสมสำหรับการตรวจสอบแต่ละประเภทคุณจะสามารถใช้งานระบบของคุณได้อย่างมีประสิทธิภาพมากขึ้น เพิ่ม SIOS AppKeeper ในการตรวจสอบและการกู้คืน EC2 ของคุณ ผลิตซ้ำจาก SIOS |