如何確保應用程序在公共雲中的可用性

採用雲計算的注意事項是一種很好的建議。雲計算服務提供商(CSP)都會承諾在其基礎設施中提供“高可用性”,其服務水平協議(SLA)通常提供95%至99.99%的正常運行時間,而每月服務費退款率將達到10%到50%不等。但通常沒有達到這樣的門檻,正如IT的許多方面一樣,重要的在於細節。

如何確保應用程序在公共雲中的可用性

而採用正確的方法,在Amazon Web Services、谷歌雲平臺和微軟Azure公共雲和混合雲環境中可以實現5個9的高可用性(HA)。這需要了解服務等級協議(SLA)中的限制,以及創建高可用配置的選項。

高可用性限制

大多數雲計算服務提供商都提供具有99.99%正常運行時間保證的服務等級協議(SLA),而跨越雲計算服務提供商(CSP)區域和/或區域的冗餘配置增加了企業獲得滿意可用性的信心。但是這種安排存在一些嚴重問題,因爲服務等級協議(SLA)中“停機時間”和“不可用”是導致應用程序失敗的原因。

不計入停機的潛在原因包括客戶的軟件,任何第三方軟件或技術,計劃的硬件和軟件維護,以及個別實例或卷的某些問題,這些問題不能歸因於某些不可用的情況。還排除了錯誤的輸入或指令,或在需要時缺乏行動,這似乎涵蓋了“人爲錯誤”可能的原因。

雲計算服務提供商(CSP)排除某些失敗原因是合理的,但系統管理員將這些作爲藉口是不負責任的。這使得有必要通過其他方式確保應用程序的更高可用性。

實現更高可靠性的選項

通常,有三種基本選項可用於提高雲計算的可用性:應用程序軟件中的規定,操作系統中內置的功能,以及專用的故障轉移集羣。

許多應用程序提供自己的高可用性(HA)規定。一個很好的例子是Microsoft SQL Server企業版中的運營商級在可用性組上始終使用的功能。這種方法的問題在於需要針對不同的應用程序提供不同的高可用性(HA)規定,這使得持續管理成爲一項持續且成本高昂的工作。

第二個選項涉及使用集成到操作系統中的高可用性(HA)功能。 Windows Server具有故障轉移集羣的本機功能,但其缺乏數據複製功能。私有云中的複製通常通過某種形式的共享存儲提供,例如存儲區域網絡(SAN)。但是,在公共雲中,共享存儲不可用,因此需要單獨的數據複製解決方案。

在Linux操作系統上,由於缺少像故障轉移集羣這樣的本機功能,因此需要單獨的高可用性(HA)規定。因此,實施高可用性(HA)需要使用像Pacemaker和Corosync這樣的開源軟件爲每個應用程序創建(然後維護)自定義腳本,並且只有規模非常大的組織纔有能力承擔所涉及的巨大而持續努力。

第三種選擇是採用第三方故障轉移集羣軟件,這是專門用於爲公共雲、私有云和混合雲上的Windows操作系統或Linux操作系統上運行的應用程序提供完整的高可用性和災難恢復解決方案。

這些解決方案至少結合了數據複製、連續應用程序級監控、可配置的故障轉移/故障恢復恢復策略。這種集成使軟件能夠檢測應用程序級別的任何和所有停機時間,無論其原因如何,其中包括各種雲計算服務等級協議(SLA)未涵蓋的原因。許多解決方案還提供高級功能,例如支持WAN優化以提高性能,以及人工切換主服務器和輔助服務器分配以促進計劃維護。

雖然這些解決方案可以在私有云中與SAN配合使用,但大多數管理員更喜歡部署無共享SANless故障轉移羣集。其原因包括:消除潛在的單點故障、獲得在公共雲中工作的能力、並最小化恢復點對象(RPO)、恢復時間對象(RTO)和最短恢復時間(MTTR)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章