高可用集羣介紹

高可用集羣

一、什麼是高可用集羣

高可用集羣就是當某一個節點或服務器發生故障時，另一個節點能夠自動且立即向外提供服務，即將有故障節點上的資源轉移到另一個節點上去，這樣另一個節點有了資源既可以向外提供服務。高可用集羣是用於單個節點發生故障時，能夠自動將資源、服務進行切換，這樣可以保證服務一直在線。在這個過程中，對於客戶端來說是透明的。

二、高可用集羣的衡量標準

高可用集羣一般是通過系統的可靠性(reliability)和系統的可維護性(maintainability)來衡量的。通常用平均無故障時間（MTTF）來衡量系統的可靠性，用平均維護時間（MTTR）來衡量系統的可維護性。因此，一個高可用集羣服務可以這樣來定義：HA=MTTF/(MTTF+MTTR)*100%。

一般高可用集羣的標準有如下幾種：

99%：表示一年宕機時間不超過4天

99.9% ：表示一年宕機時間不超過10小時

99.99%：表示一年宕機時間不超過1小時

99.999% ：表示一年宕機時間不超過6分鐘

三、高可用集羣的三種方式

實現高可用集羣有三種方式：

（1）、主從方式（非對稱）

這種方式組建的高可用集羣通常包含2個節點和一個或多個服務器，其中一臺作爲主節點（active），另一臺作爲備份節點（standy）。備份節點隨時都在檢測主節點的健康狀況，當主節點發生故障時，服務會自動切換到備份節點上以保證服務正常運行。

這種方式下的高可用集羣其中的備份節點平時不會啓動服務，只有發生故障時纔會有用，因此感覺比較浪費。

（2）、對稱方式

這種方式一般包含2個節點和一個或多個服務，其中每一個節點都運行着不同的服務且相互作爲備份，兩個節點互相檢測對方的健康狀況，這樣當其中一個節點發生故障時，該節點上的服務會自動切換到另一個節點上去。這樣可以保證服務正常運行。

（3）、多機方式

這種集羣包含多個節點和多個服務。每一個節點都可能運行和不運行服務，每臺服務器都監視着幾個指定的服務，當其中的一個節點發生故障時，會自動切換到這組服務器中的一個節點上去。

四、高可用集羣的組件

實現高可用集羣需要用到如下組件：

1、Messaging Layer：可以理解爲信息層，主要的作用是傳遞當前節點的心跳信息，並告知給對方，這樣對方就知道其他節點是否在線。如果不在線，則可以實現資源轉移，這樣另一臺節點就可以充當主節點，並正常提供服務。傳遞心跳信息一般使用一根心跳線連接，該線接口可以使用串行接口也可以是以太網接口來連接。每一個節點上都包含信息層。

可以提供該組件的軟件有：

（1）、heartbeat

heartbeat有三個版本即heartbeat v1、heartbeat v2和heartbeat v3

heartbeat v1是比較老的版本，heartbeat v2是目前穩定的版本，在做實驗的時候使用該版本。

（2）、corosync(openAIS的子項目)

（3）、keepalive

（4）、cman

Heartbeat 是比較常用的軟件，Keepalived配置相對比較簡單，而ultramonkey好像不怎麼常用，Corosync比heartbeat功能還要強大，功能更加豐富。
後續實驗過程以上三種都會使用到

2、CRM：Cluster Resource Messager,該組件叫做資源管理器，它主要是用來提供那些不具有高可用的服務提供高可用性的。它需要藉助Messaging Layer來實現工作，因此工作在Messaging Layer上層。資源管理器的主要工作是根據messaging Layer傳遞的健康信息來決定服務的啓動、停止和資源轉移、資源的定義和資源分配。在每一個節點上都包含一個CRM，且每個CRM都維護這一個CIB（Cluster Internet Base，集羣信息庫），只有在主節點上的CIB是可以修改的，其他節點上的CIB都是從主節點那裏複製而來的。在CRM中還包含LRM和DC等組件。

可以提供CRM的軟件有：

heartbeat v1自帶的資源管理爲haresource

heartbeat v2自帶的資源管理有haresource和crm

其中crm由於配置文件是XML格式的，大多數人如果不懂其語法格式的話，可能會出現配置錯誤。因此crm提供了一個監聽端口，可以用其它GUI工具來配置管理集羣

Heartbeat V3 版後資源管理器獨立出來，而不是作爲Heartbeat的一部分了，它的名字叫Pacemaker功能異常強大，還提供了命令行工具來管理集羣。

Cman 是紅帽開發的一個資源管理器，在紅帽5.X版本上可能遇到，6.x版本後紅帽也開始使用強大的pacemaker

3、LRM：Local Resource Messager，叫做本地資源管理器，它是CRM的一個子組件，用來獲取某個資源的狀態，並且管理本地資源的。例如：當檢測到對方沒有心跳信息時，則會啓動本地相應服務。

4、DC：可以理解爲事務協調員，這個是當多個節點之間彼此收不到對方的心跳信息時，這樣各個節點都會認爲對方發生故障了，於是就會產塵分裂狀況（分組）。並且都運行着相關服務，因此就會發生資源爭奪的狀況。因此，事務協調員在這種情況下應運而生。事務協調員會根據每個組的法定票數來決定哪些節點啓動服務，哪些節點停止服務。例如高可用集羣有3個節點，其中2個節點可以正常傳遞心跳信息，與另一個節點不能相互傳遞心跳信息，因此，這樣3個節點就被分成了2組，其中每一個組都會推選一個DC，用來收集每個組中集羣的事務信息，並形成CIB，且同步到每一個集羣節點上。同時DC還會統計每個組的法定票數（quorum），當該組的法定票數大於二分之一時，則表示啓動該組節點上的服務；否則停止該節點上的服務。對於某些性能比較強的節點來說，它可以投多張票，因此每個節點的法定票數並不是只有一票，需要根據服務器的性能來確定。DC一般位於主節點上。

5、PE和TE

PE和TE也是DC的子組件，其中：

PE（Policy Engine）：策略引擎，來定義資源轉移的一整套轉移方式，但只是做策略者，並不親自來參加資源轉移的過程，而是讓TE來執行自己的策略。

TE（Transition Engine）：就是來執行PE做出的策略的並且只有DC上才運行PE和TE。

6、stonithd組件
STONITH(Shoot The Other Node in the Head，”爆頭“)，這種方式直接操作電源開關，當一個節點發生故障時，另一個節點如果能偵測到，就會通過網絡發出命令，控制故障節點的電源開關，通過暫時斷電，而又上電的方式使故障節點被重啓動或者直接斷電，這種方式需要硬件支持。

如果備份節點在某一時刻不能收到主節點的心跳信息時，那麼如果此時備份節點立刻搶佔資源時，而此時主節點正好在執行寫操作，備份節點一旦也執行相應的寫操作，會導致文件系統錯亂或者服務器崩潰，因此在搶佔資源的時候可以使用資源隔離機制來防止此類事件發生。而我們常常使用stonithd（即爆頭）來使主節點不在搶佔資源。

其中資源隔離包括：

（1）、節點級別

使用stonithd設備來實現

（2）、資源級別

例如：使用FC SAN switch可以實現在存儲資源級別拒絕某節點的訪問

7、共享存儲

對於某些服務如http、mysql等服務，需要將某些數據共享，這樣當使用不同的節點來訪問存儲設備時，都可以返回正確的信息。如果不使用存儲設備，假設http服務爲例，當某個客戶想訪問某個圖片時，如果這個圖片只放在某個指定的服務器上時，一旦該服務器掛了，http服務就會切換到另一臺設備上去，而另一臺設備上面沒有該圖片，那麼該用戶此時就不能訪問該圖片了，當然這種情況是我們不想看到了。爲了解決這類事件發生，可以使用共享存儲設備，將相關的數據放在共享設備上，這樣無論那一臺服務器掛了，都不會影響用戶的訪問。

常用的共享存儲設備有如下三種：

DAS:Direct Attached Storage,直接附加存儲

NAS：Network Attached Storage，網絡附加存儲

SAN：Storage Area Network，存儲區域網絡

因此，一個高可用集羣服務的組件架構大概是這樣子的：

8、資源

在上面好多地方都講到了資源，那麼什麼是資源呢？實現一個高可用性需要那些資源呢？

其實資源就是啓動一個服務需要的子項目。例如啓動一個httpd服務，需要ip，也需要服務腳本、還需要文件系統（用來存儲數據的），這些我們都可以統稱爲資源。因此，實現一個高可用集羣一般需要

ip、服務（腳本）和文件系統（存儲數據），當然有些高可用集羣不需要存儲設備的。

資源也是有類型的，可以分爲這樣幾類：

（1）、primitive：可以理解爲主資源，有時候看到的會是native，都是一個意思，該資源只在主節點上有。（當然備份節點一旦將資源奪過來了，也就成了主節點，因此，主節點是相對來說的）

（2）、group：組資源，將多個資源綁定在一個同一個組上面且運行在同一個節點上。

（3）、clone：是將primitive資源克隆n份且運行在每一個節點上

（4）、master/slave：也是將primitive克隆2份、其中master和slave節點各運行一份，且只能在這2個節點上運行。

對於某些集羣服務來說，啓動相關的資源是有先後順序的。例如啓動一個mysql集羣服務，首先應該先掛載共享存儲設備，否則即時mysql服務啓動起來了，用戶也訪問不了數據。因此，一般說來，我們需要將資源進行約束。資源約束有如下幾類：

（1）、位置約束（location）：資源對節點的傾向程度，通常可以使用一個分數（score）來定義，當score爲正值時，表示資源傾向與此節點；負值表示資源傾向逃離於此節點。也可以將score定義爲-inf(負無窮大)和inf（正無窮大）。例如：有三個節點rs1、rs2、rs3當rs1是主節點且發生故障時，則比較rs2和rs3的score值，誰是正值，則資源將會轉移到哪個節點上去。

（2）、排列約束（colocation）：用來定義資源是否可以在一起，通常也是使用一個score來定義的。當score是正值表示資源可以在一起；否則表示不可以在一起。通過定義資源類型爲group也可以來將所有資源綁定在一起。

（3）、順序約束（order）：用來定義資源啓動和停止的順序。例如，首先應該先掛載共享存儲，在啓動httpd或mysqld服務才行吧。

資源粘性：用來定義資源是否傾向留在該節點。通常使用score來定義，當score爲正數表示樂意留在當前節點，負數表示不樂意留在當前節點。

當某個高可用集羣即包含資源粘性又包含位置約束，一旦該節點發生故障後，資源就會轉移到另一個節點上去。但是當之前的節點恢復正常時，需要比較所有的資源粘性之和與所有位置約束之和誰大誰小，這樣資源纔會留在大的一方。

資源轉移

將有故障節點的VIP設置到另一個節點上去，並在另一個節點啓用相應的服務，掛載相應的存儲設備等等都可以叫做資源轉移。

9、資源代理（Resource Agent）

RA實際負責啓動資源的，LRM用來管理本地資源的，但是不能啓動資源，當需要啓動資源時會調用RA來啓動，RA是一個腳本文件，在一個節點上可能有多個RA。通常在rhel上，啓動系統服務的不也都是一些腳本文件嗎。常見的RA有如下風格：

（1）、LSB（Linux Standard Base），這是一種我們常見的如/etc/init.d/下的標準linux腳本風格。

（2）、OCF(Open Cluster Framwork)：OCF腳本是比LSB更強大的一種腳本，支持更多的參數

一般說來，構建一個高可用集羣服務需要以上組件才能完成。

接下來關於實驗部分將在後文介紹

本文出自 “linux學習之路” 博客，請務必保留此出處http://xslwahaha.blog.51cto.com/4738972/1601706

linux高可用集羣(HA)原理詳解

標籤：高可用集羣高可用集羣原理介紹高可用集羣組件

高可用集羣介紹

Unix 環境高級編程第三版配置 apue.h

高可用集羣介紹

HPC 高性能集羣基礎環境安裝

linux下 ssh 實現無需密碼的遠程登陸

高可用集羣介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結