Date: 30 10 月, 2023
如何購買最佳的高可用性解決方案
高可用性對於保護 IT 基礎架構免遭停機至關重要,但如何找到最佳的 HA 解決方案來購買?我們概述了為什麼很難弄清楚要購買什麼,以及讓管理層參與投資高可用性所需採取的步驟。
為什麼購買優質的 HA 解決方案如此困難?
Barbara Joan(化名)領導的團隊負責公司大部分 IT 基礎設施,並不斷努力說服管理階層投資高可用性。每當她建議實施高可用性 (HA) 保護時,不同的同事都會表達他們的保留意見、反對意見、替代方案建議,甚至淡化自己企業應用程式過去幾次中斷的嚴重性。
她總是問自己同樣的問題:如果根據組織、行業和受影響的應用程序,停機成本估計在 45,000 美元到 500,000 美元之間,那麼為什麼協調一致購買優質的產品如此困難?(成本有效)HA 解決方案?
讓您的管理層相信 HA 是一項偉大投資的七種方法
1.考慮避免成本的投資報酬率
HA 的投資報酬率更準確地計算為成本避免。也就是說,將採取行動保持當前預期成本(增加高可用性)的成本與不採取行動(停機時間)的成本進行比較。
如果沒有 HA 保護,停機是不可避免的,因為 IT 系統會受到多種停機因素的影響,從機械伺服器故障到人為錯誤,再到軟體不相容等等。成本也根據不同的情況而有所不同。產業以及公司的規模。與具有本地或區域業務的小型公司相比,具有嚴格 SLA 和每天數百萬筆交易的大型製造商將因計劃外停機而遭受更大的損失。此外,如果您的企業受到嚴格監管或重要的服務提供者,則可能會因停機而產生額外的處罰成本,而不僅僅是所售產品和貨物的損失。當 IT 評估人員錯誤地計算停機成本時,購買強大的商業解決方案就會變得更加困難。
-
考慮整體解決方案的成本
停機本身對公司造成的損失幾乎是無法估量的——聲譽受損、客戶不滿以及 IT 員工沮喪等等。芭芭拉瓊 (Barbara Joan) 厭倦了為了應對壓力大、有時甚至是混亂的停機事件而中斷她的富有成效的工作。您如何計算停機時間對昂貴的員工流動率造成的影響?
-
合適的醫管局能夠回收成本
一些公司認為,HA 解決方案的成本只是所需軟體和伺服器的成本。他們認為他們可以使用內部資源或雲端來創建自己的。然而,這些公司忘記考慮解決方案的許多不同方面及其各自的隱性成本。例如,本土解決方案在短期內實施起來可能更便宜,但它們通常包含隱性成本,例如維護、持續支援、團隊培訓、文件、技術債務和故障修復開發。此外,許多本土解決方案在證明「我們可以在內部更便宜地完成」估計時,不一定會估計或解釋團隊不會做的其他工作。與任何 DIY 專案一樣,有些事情最好留給專家來做。
-
明確定義停機時間的含義
停機有多種版本;有計劃的和無計劃的。停機包括由平台不可用、應用程式崩潰、硬體故障、網路中斷、實體資料中心問題、漏洞以及人為錯誤引起的問題。在某些評估中,客戶和 IT 評估人員將注意力集中在平台的可用性上,而忽略了其他停機原因。例如,一家大型製造公司的專案經理討論說,雖然雲端平台提供了更多的彈性、可靠性和冗餘性,但它們並沒有涵蓋影響可用性的所有問題。他接著描述了許多評估人員忘記的導致停機的根本原因。
-
明確相關術語
最近,我加入了一個行業小組,討論典型客戶對應用程式可用性的需求。在最初的五分鐘內,幾位小組參與者已經使用了十幾個或更多不同術語的縮寫和縮寫詞。雖然有些很容易理解,但其他一些則非常小眾或基於 IT 專業人士的背景。例如:HA+DR。這就是高可用+災難復原或高可用性資料複製?首字母縮寫的使用,加上具有不同行業知識和經驗水平的人之間對術語的不同使用,也會在購買過程中造成混亂和摩擦。身為客戶體驗副總裁,一位客戶評估遇到了採購團隊之間的嚴重摩擦,因為一位審核者認為公司只需要 HA 解決方案,而另一位則提到了 HA+DR。最後,兩人意識到一個HA包含兩個節點,另一個HA是兩個節點加DR。
-
明確HA解決方案的作用
期望是另一個經常阻礙購買 HA 解決方案的因素。作為客戶體驗副總裁,我們與一位客戶合作,該客戶正在處理導致反覆停機的平台和應用程式不穩定問題。在評估過程中,客戶感嘆HA方案未能解決平台不穩定問題。在負載下,硬體 CPU 和記憶體出現問題,網路變得不穩定,幾乎無法使用。客戶沒有透過足夠規模的系統或可靠的基礎設施來解決底層平台問題,而是將故障歸咎於 HA 解決方案,並走向了不同的方向。IT 管理員有時很難與管理階層設定關於 HA 可以做什麼和不能做什麼的期望。HA 解決方案並不是解決所有 IT 基礎架構問題的靈丹妙藥,而是健全架構的重要組成部分。當對解決方案或要求的期望發生誤解時,購買通常會受到阻礙或阻止。
-
解釋為什麼雲端 SLA 不提供應用程式 HA
查看您的雲端平台 SLA,並充分了解它們將涵蓋和不涵蓋的內容。許多平台為先前飽受詬病的資料中心提供了急需的基礎設施穩定性、可靠性和靈活性。然而,對於大多數應用程式來說,可用性和正常運行時間的責任仍然由 IT 管理員而不是雲端供應商承擔。無論您的系統位於何處、本地或雲端,都不存在「100% 放手」的 HA 方法。
當然,這並不是導致購買出色的 HA 解決方案變得困難的誤解的完整清單。其他值得注意的誤解經常發生在調度過程、用例的優先順序、需求的定義和澄清、成功標準、預算、預算權限以及對不採用企業商業 HA 解決方案的風險的理解(或缺乏理解)。聯絡SIOS了解有關我們 HA 解決方案的更多資訊。
獎金:
消除組織各層之間的誤解評估、購買和部署出色的 HA 解決方案的一個主要挑戰是由於組織不同層之間的誤解而出現的。回想一下第一組成本誤解,並考慮每個負責成本合理性的人可能需要向老闆解釋以獲得批准。現在考慮每個人老闆的背景;他們是技術人員還是非技術人員,在同一團隊還是組織的不同部分?現在考慮公司各個 IT 層之間的關係,以及他們的需求和溝通如何影響討論和決策。SIOS 客戶體驗團隊合作的許多公司的 IT 部門的每個部分都有多個技術團隊;資料庫、應用程式、平台、網路、安全等。每個技術團隊都必須進行良好的溝通,以定義需求、期望和成功標準。這種程度的溝通並不容易發生,當所有團隊都處於遠端且位於不同時區時,這種溝通會變得更加困難。
-Cassius Rhue,客戶體驗副總裁
經許可轉載安全作業系統