Date: Agustus 9, 2017
Anda mungkin pernah mendengar tentang penghentian penyimpanan baru-baru ini yang berdampak pada beberapa kasus di wilayah Timur AS pada 16 Maret. Analisis akar penyebab pemadaman dikirim di sini.
16 Maret US Storage Storage Timur
Dampak pelanggan: Sejumlah pelanggan yang menggunakan Storage di wilayah Timur AS mungkin telah mengalami kesalahan dan batas waktu saat mengakses akun penyimpanan mereka dalam satu unit skala Penyimpanan
Anda mungkin bertanya, "Apa itu unit skala Penyimpanan tunggal". Nah, Anda bisa menganggapnya sebagai satu cluster penyimpanan tunggal, atau satu SAN, atau betapapun Anda ingin memikirkannya. Saya tidak berpikir Azure menerbitkan infrastruktur yang tepat mereka, tapi Anda mungkin bisa menduga bahwa di balik layar mereka menggunakan Scale Out File Servers untuk penyimpanan backend.
Jadi pertanyaannya adalah, bagaimana saya bisa bertahan dari gangguan ini dengan downtime minimal? Jika Anda membaca lebih jauh analisis akar penyebab yang Anda temukan di nugget kecil ini.
Mesin Virtual yang menggunakan Disk Managed dalam Set Ketersediaan akan menjaga ketersediaan selama kejadian ini.
Apa Disk Dikelola Anda bertanya? Nah, tepat pada tanggal 8 Februari Corey Sanders mengumumkan GA of Managed Disks. Anda bisa membaca semua tentang Managed Disks di sini. https://azure.microsoft.com/en-us/services/managed-disks/
Alasan mengapa Managed Disk akan membantu dalam pemadaman ini adalah dengan memanfaatkan Set Ketersediaan yang digabungkan dengan Disk Terkelola, Anda memastikan bahwa masing-masing contoh di Set Ketersediaan Anda terhubung ke unit penyimpanan Storage yang berbeda. Jadi, dalam kasus khusus ini, hanya satu dari simpul gugus Anda yang akan gagal, sehingga meninggalkan simpul yang tersisa untuk mengambil alih beban kerja.
Sebelum Disk yang Dikelola tersedia (apa pun yang ditempatkan sebelum 2/8/2016), tidak ada cara untuk memastikan bahwa penyimpanan yang terpasang pada server Anda berada pada unit skala Penyimpanan yang berbeda. Tentu, Anda bisa menggunakan akun penyimpanan yang berbeda untuk setiap kasus, namun kenyataannya tidak menjamin penyimpanan Penyimpanan Akun Storage tersebut pada unit skala Penyimpanan yang berbeda.
Jadi, sementara Set Ketersediaan memastikan bahwa contoh Anda berada di Domain Fault dan Domain Pembaruan yang berbeda untuk memastikan ketersediaan instance itu sendiri, penyimpanan tambahan yang melekat pada setiap contoh benar-benar mewakili satu titik kegagalan. Meskipun penyimpanan itu sendiri sangat tangguh, dengan tiga salinan data dan opsi geo-redundant Anda tersedia, dalam hal ini dengan kegagalan daya, seluruh unit skala Penyimpanan turun bersamaan dengan semua server yang menyertainya.
Singkat cerita … bermigrasi ke Managed Disk sesegera mungkin untuk membantu meminimalkan downtime
Dan jika Anda benar-benar ingin meminimalkan downtime, Anda harus mempertimbangkan Hybrid Cloud Deployments yang mencakup penyedia cloud atau on-prem to cloud!