高可用集羣原理

1.高可用集羣概念

    高可用集羣就是當某一個節點或服務器發生故障時,另一個節點能夠自動且立即向外提供服務,即將有故障節點上的資源轉 移到另一個節點上去,這樣另一個節點有了資源既可以向外提供服務。高可用集羣是用於單個節點發生故障時,能夠自動將資源、服務進行切換,這樣可以保證服務 一直在線。在這個過程中,對於客戶端來說是透明的。

2.高可用集羣組件

wKioL1XvBJOB9a5mAAEKDcK7zeE336.jpg

    1).Messaging Layer:集羣服務信息層,主要的作用是傳遞當前節點的心跳信息,並告知給對方,這樣對方就知道其他節點是否在線。如果不在線,則可以實現資源 轉移,這樣另一臺節點就可以充當主節點,並正常提供服務。傳遞心跳信息一般使用一根心跳線連接,該線接口可以使用串行接口也可以是以太網接口來連接。每一 個節點上都包含信息層。

    2).CRM:Cluster  Resource Messager,該組件叫做資源管理器,它主要是用來提供那些不具有高可用的服務提供高可用性的。它需要藉助Messaging  Layer來實現工作,因此工作在Messaging Layer上層。資源管理器的主要工作是根據messaging Layer傳遞的健康信息來決定服務的啓動、停止和資源轉移、資源的定義和資源分配。在每一個節點上都包含一個CRM,且每個CRM都維護這一個 CIB(Cluster Internet  Base,集羣信息庫),只有在主節點上的CIB是可以修改的,其他節點上的CIB都是從主節點那裏複製而來的。在CRM中還包含LRM和DC等組件。

    3).DC:事務協調員,其包括PE和TE兩個子模塊,DC負責收集每個組中集羣的事務信息,並形成CIB,且同步到每一個集羣節點上。同時DC還會統計每個組的法定票數(quorum),當該組的法定票數大於二分之一時,則表示啓動該組節點上的服務;否則停止該節點上的服務。DC一般位於主節點上。

    4).PE和TE:PE和TE是DC的子組件,PE(Policy Engine),策略引擎,來定義資源轉移的一整套轉移方式,但只是做策略者,並不親自來參加資源轉移的過程,而是讓TE來執行自己的策略。TE(Transition Engine),事務引擎, 就是來執行PE做出的策略的。

    5).LRM:Local Resource  Messager,叫做本地資源管理器,它是CRM的一個子組件,用來獲取某個資源的狀態,並且管理本地資源的。例如:當檢測到對方沒有心跳信息時,則會啓動本地相應服務。

    6).RA:Resource Agent,資源代理,實際負責啓動關閉資源的,LRM用來管理本地資源的,但是不能啓動關閉資源,當需要啓動關閉資源時會調用RA來啓動,RA是一個個腳本文件,在一個節點上可能有多個RA。常見的RA風格有OCF和LSB。

    7).stonith:如果備份節點在某一時刻不能收到主節點的心跳信息時,那麼如果此時備份節點立刻搶佔資源時,而此時主節點正好在執行寫操作,備份節點一旦也執行相應的寫操作,會導致文件系統錯亂或者服務器崩潰,因此在搶佔資源的時候可以使用資源隔離機制來防止此類事件發生。而我們常常 使用stonithd(即爆頭)來使主節點不再搶佔資源。

3.資源

    資源就是啓動一個服務需要的子項目。例如啓動一個httpd服務,需要ip,也需要服務腳本、還需要文件系統(用來存儲數據的),這些我們都可以統稱爲資源。

    資源類型

        primitive:可以理解爲主資源,有時候看到的會是native,都是一個意思,表示在某一時刻只能運行在某一結點上的資源。

        group:組資源,將多個資源綁定在一個同一個組上面且運行在同一個節點上。

        clone:是將primitive資源克隆n份且運行在多個節點上。

        master/slave:也是將primitive克隆2份、其中master和slave節點各運行一份,且只能在這2個節點上運行。

    資源粘性:資源是否傾向於留在當前節點。通常使用score來定義,當score爲正數表示樂意留在當前節點,負數表示不樂意留在當前節點。

    資源約束

        位置約束(location):資源對節點的傾向程度,通常可以使用一個分數(score)來定義,當 score爲正值時,表示資源傾向與此節點;負值表示資源傾向逃離於此節點。也可以將score定義爲-inf(負無窮大)和inf(正無窮大)。例如: 有三個節點rs1、rs2、rs3當rs1是主節點且發生故障時,則比較rs2和rs3的score值,誰是正值,則資源將會轉移到哪個節點上去。

        排列約束(colocation):用來定義資源是否可以在一起,通常也是使用一個score來定義的。當score是正值表示資源可以在一起;否則表示不可以在一起。通過定義資源類型爲group也可以來將所有資源綁定在一起。

        順序約束(order):用來定義資源啓動和停止的順序。例如,首先應該先掛載共享存儲,再啓動httpd或mysqld服務才行吧。

    資源隔離級別:資源隔離是爲了集羣產生腦裂時防止由於搶佔共享存儲導致文件系統崩潰。

        節點級別:使用stonithd設備來實現。

        資源級別:使用FC SAN switch可以實現在存儲資源級別拒絕某節點的訪問。

參考資料:

linux高可用集羣原理詳解:http://www.mamicode.com/info-detail-416675.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章