Date: 9 8 月, 2017
您可能已經聽說過最近的存儲中斷,影響了美國東部地區在3月16日的一些情況。 停電的根本原因分析在這裡張貼。
客戶影響:在美國東部地區使用Storage的客戶的一小部分可能在單個存儲量表單元訪問其存儲帳戶時遇到錯誤和超時
您可能會問:“什麼是單個存儲量表單元”。 那麼,你可以把它看成一個單一的存儲集群,或是一個SAN,或者你想要考慮它。 我不認為Azure發布其精確的基礎架構,但是您可以假設幕後使用的是擴展文件服務器來進行後端存儲。
所以問題是,如何以最短的停機時間在這種停電中倖存下來?如果你進一步閱讀根本原因分析,你會遇到這個小塊。
在可用性集中使用託管磁盤的虛擬機將在此事件期間保持可用性。
什麼是託管磁盤你問?那麼就在2月8日,科里·桑德斯(Corey Sanders)宣布管理磁盤陣列。 您可以在這裡閱讀有關託管磁盤的所有信息。 https://azure.microsoft.com/en-us/services/managed-disks/
託管磁盤有助於中斷這一原因是通過利用可用性集合與託管磁盤組合,您可以確保可用性集中的每個實例都連接到不同的“存儲量表單元”。 因此,在這種特殊情況下,只有一個集群節點將失敗,剩下的節點才能接管工作負載。
在託管磁盤可用之前(任何部署在2/8/2016之前),沒有辦法確保連接到您的服務器的存儲位於不同的存儲容量單位上。 當然,您可以為每個實例使用不同的存儲帳戶,但實際上並不能保證這些存儲帳戶在不同的存儲量表單元上配置存儲。
因此,當可用性集確保您的實例駐留在不同的故障域和更新域中以確保實例本身的可用性時,附加到每個實例的額外存儲確實代表了單點故障。 雖然存儲本身俱有高度的靈活性,但可以使用三個數據副本和地理冗餘選項,在這種情況下,電源故障,整個存儲量表單元與連接的所有服務器一起下降。
這麼長的故事簡短…盡快遷移到託管磁盤,以幫助最小化停機時間
如果您真的想減少停機時間,那麼您應該考慮跨雲提供商的混合雲部署或云計算的一體機。