第一章 高可用性解決方案 - HA
解決方案中的問題
高可用性(HA
)指的是使系統或應用程序在長時間內保持正常運行並可供用戶使用的目標,從而最大限度地減少計劃內和計劃外停機時間。 IRIS
提供自己的HA
解決方案,並輕鬆與操作系統提供商提供的常見HA
解決方案集成。
維護高系統可用性的主要機制稱爲故障轉移。在這種方法下,故障的主系統由備用系統代替;也就是說,生產故障轉移到備份系統。許多HA
配置還提供了災難恢復(DR
)機制,即當HA
機制無法保持系統可用時,恢復系統可用性。
本頁簡要討論可與基於 IRIS
的應用程序一起使用的一般 HA
策略,然後涵蓋 IRIS HA
解決方案中的問題,提供 HA
解決方案功能比較,並討論使用分佈式緩存和故障轉移策略
IRIS HA
解決方案中的問題
在爲IRIS
系統評估潛在的 HA
解決方案時,請牢記以下兩個重要問題:
- 共享存儲
HA
架構的一個重要原則是避免單點故障。大多數 HA
解決方案依賴於共享存儲組件;這代表了這樣的風險;如果存儲出現故障,就不可能保持系統可用。存儲級冗餘可以在一定程度上減輕這種風險,但也可以延續某些類型的數據損壞。
另一方面,IRIS
鏡像在完全獨立的主存儲和備份存儲之間使用邏輯數據複製,完全消除了單點故障問題並避免了大多數類型的損壞。
-
IRIS
升級
許多 HA
解決方案允許在不中斷整體可用性的情況下對給定組件系統進行計劃內停機。然而,大多數都需要大量的停機時間來升級生產 IRIS
實例。
然而,當應用程序代碼、類和例程與應用程序數據保存在不同的數據庫中時,IRIS
鏡像允許將停機時間降至最低。另一方面,鏡像以外的 HA
解決方案需要爲 IRIS
升級或任何其他需要關閉 IRIS
的維護仔細規劃停機時間窗口。
無 HA 解決方案
IRIS
數據庫的結構和邏輯完整性始終受到數據完整性指南“數據完整性簡介”一章中描述的內置功能的保護,免受生產系統故障的影響:寫入圖像日誌記錄、數據庫日誌記錄和事務處理。但是,如果沒有 HA
解決方案,故障可能會導致大量停機,具體取決於故障原因以您隔離和解決故障的能力。對於許多非關鍵業務的應用程序,這種風險可能是可以接受的。
採用這種方法的客戶具有以下特點:
- 清晰詳細的操作恢復程序,包括日誌記錄、備份和恢復。
- 磁盤冗餘(
RAID
和/或磁盤鏡像)。 - 能夠快速更換硬件。
- 與所有供應商簽訂
24/7
維護合同。 - 管理接受度和應用程序用戶對故障導致的中等停機時間的容忍度。
操作系統級集羣 HA
在操作系統級別提供的常見 HA
解決方案是故障轉移集羣,其中主要生產系統由(通常相同的)備用系統補充,具有共享存儲和跟隨活動成員的集羣 IP
地址。如果生產系統出現故障,備用系統將承擔生產工作負載,接管之前在故障主系統上運行的程序和服務。備用數據庫必須能夠處理正常的生產工作負載,只要它可能需要恢復發生故障的主數據庫。可選地,備用數據庫可以成爲主要數據庫,故障的主要數據庫在恢復後成爲備用數據庫。
IRIS
旨在輕鬆與支持平臺的故障轉移集羣技術集成(如 支持的平臺中所述)。一個 IRIS
實例安裝在集羣的共享存儲設備上,以便兩個集羣成員都能識別它,然後將其添加到集羣配置中,以便作爲故障轉移的一部分在備用數據庫上自動重啓。故障轉移後重新啓動時,系統會自動執行正常的啓動恢復,保持結構和邏輯完整性,就好像 IRIS
在故障系統上重新啓動一樣。如果需要,可以在單個集羣上安裝多個 IRIS
實例。