Apa yang terjadi? Berikut Azure Outage Post Mortem Bagian 2 kami
Apa yang terjadi? Berikut Azure Outage Post Mortem Bagian 2 kami
Posting blog saya sebelumnya mengatakan bahwa Cloud-to-Cloud atau Hybrid-Cloud akan memberi Anda isolasi paling banyak dari hampir semua masalah yang dihadapi CSP. Namun sebagian besar downtime yang disebabkan oleh bencana alam ini bisa dihindari jika Zona Ketersediaan tersedia di wilayah Tengah Selatan. Microsoft menerbitkan RCA Pendahuluan tentang Penghentian Tengah Selatan 4 September. Bagian terpenting dari keseluruhan ringkasan itu adalah sebagai berikut …
“MENGGUNAKAN REDUMSI DITETAPKAN, ADA SKENARIO DI DALAM KEKURANGAN PENDINGINAN DATACENTER DAPAT MENGAKTIFKAN PELATIH PELANGGAN DI DATACENTER YANG TERKENA.”
Apa Arti Itu Bagi Anda?
Jika semua aplikasi Anda berjalan di pusat data yang sama, Anda rentan terhadap jenis pemadaman yang sama di masa mendatang. Dalam pembelaan Microsoft, ini benar-benar tidak boleh menjadi berita untuk Anda. Ini selalu benar apakah Anda menjalankan di Azure, AWS, Google atau bahkan datacenter Anda sendiri. Kegagalan untuk merencanakan ke depan dengan replikasi data ke pusat data yang berbeda dan rencana untuk memulihkan aplikasi Anda dengan cepat hanyalah kurangnya perencanaan di pihak Anda. Microsoft tidak mempublikasikan lokasi Zona Ketersediaan yang tepat. Jika Anda yakin peta ini diterbitkan di sini, Anda bisa menebak bahwa mereka mungkin di mana saja dari 2-10 mil terpisah satu sama lain. Dalam semua kasus kecuali yang paling ekstrim, mereplikasi data di Zona Ketersediaan harus cukup untuk perlindungan data. Beberapa aplikasi seperti SQL Server telah dibangun dalam teknologi replikasi. Namun untuk berbagai aplikasi, sistem operasi dan tipe data, lakukan selidiki replikasi replikasi level blok SANless. Solusi cluster SANless secara tradisional telah digunakan untuk cluster multisite. Namun teknologi yang sama juga dapat digunakan di cloud di Zona Ketersediaan, Wilayah, atau Hybrid-Cloud untuk ketersediaan tinggi dan pemulihan bencana. Menerapkan cluster SANless yang membentang Zona Ketersediaan, baik itu Azure, AWS atau Google, adalah proses yang sangat sederhana yang diberikan alat yang tepat. Sebagai bagian dari post mortal pemusnahan biru, berikut adalah beberapa sumber daya untuk membantu Anda memulai. Langkah-demi-Langkah: Mengonfigurasi Cluster Server File di Azure yang Membagi Zona Ketersediaan Cara Membuat Server Instan SQL Server Failover Cluster di Google Cloud Platform MS SQL Server v.Berikutnya di Linux dengan Replikasi dan Ketersediaan Tinggi #Azure #Cloud #Linux Menyebarkan Microsoft SQL Server 2014 Failover Cluster di #Airure Resource Manager (ARM) SANless SQL Server Cluster di AWS SANless Linux Cluster di AWS Quick Start
Pelajaran Dari Azure Outage Post Mortem
Jika Anda berada di Azure, Anda mungkin juga ingin mempertimbangkan Azure Site Recovery (ASR). ASR memungkinkan Anda mereplikasi seluruh VM dari satu wilayah Azure ke wilayah lain. ASR akan mereplikasi VM Anda secara real-time dan memungkinkan Anda untuk melakukan tes DR yang tidak mengganggu kapan pun Anda suka. Mendukung sebagian besar versi Windows dan Linux dan relatif mudah untuk diatur. Anda juga dapat membuat pekerjaan replikasi yang memiliki “Multi-VM Consistency”. Ini berarti bahwa server harus dipulihkan dari titik waktu yang sama dapat digabungkan dalam grup konsistensi ini dan mereka akan memiliki titik pemulihan yang sama persis. Pada dasarnya, jika Anda membangun cluster SANless dengan DataKeeper di satu wilayah untuk ketersediaan tinggi, Anda memiliki dua opsi untuk DR. Salah satunya adalah Anda dapat memperpanjang cluster SANless Anda ke node di wilayah yang berbeda, atau Anda bisa menggunakan ASR untuk mereplikasi kedua node dalam kelompok konsistensi.
Apa bedanya?
Trade off dengan ASR adalah bahwa RPO dan RTO tidak sebaik yang akan Anda dapatkan dengan cluster multi-situs SANless. Meskipun mudah dikonfigurasi dan berfungsi hanya dengan aplikasi apa pun. Hati-hati. Jika aplikasi Anda melebihi 10 MBps dalam aktivitas penulisan disk secara rutin, ASR tidak akan dapat mengikuti. Juga, klaster berdasarkan Storage Spaces Direct tidak dapat direplikasi dengan ASR dan secara umum tidak memiliki strategi DR yang baik ketika digunakan di Azure. Untuk sementara setelah Managed Disks dirilis, ASR tidak sepenuhnya mendukung mereka hingga sekitar satu tahun kemudian. Dukungan penuh untuk Managed Disks adalah rintangan besar bagi banyak orang yang ingin menggunakan ASR. Untungnya sejak sekitar Februari 2018, ASR sepenuhnya mendukung Managed Disks. Namun, ada masalah lain yang baru saja diperkenalkan. Dengan diperkenalkannya Zona Ketersediaan, ASR sekali lagi tertangkap di belakang waktu. Mereka saat ini tidak mendukung VM yang telah diterapkan di Zona Ketersediaan.
Saya pergi ke depan dan mencobanya. Tampaknya mungkin untuk mengkonfigurasi replikasi dan saya bisa melakukan uji failover.
Baca lebih lanjut tentang analisis saya tentang Pos Mortal Azure Outage yang direproduksi dengan izin dari Clusteringformeremortals.com