集羣
主要講了HA(HighAvailability)網絡高可用(在大多數情況下網絡不會掛掉)。
配置:啓動三個企業6的虛擬機、關閉火牆和selinux
每臺虛擬機上最好配置好解析,這樣快(/etc/hosts)
eg:
修改主機名分別爲(/etc/sysconfig/network):
Server1.example.com(管理機、控制端)
Server2.example.com(節點)
Server3.example.com(節點)
配置三個虛擬機的yum源爲(在/etc/yum.repos.d)
[Server]
name=localserver
baseurl=http://172.25.9.250/rh6.5
gpgcheck=0
[HighAvailability]
name=localserver
baseurl=http://172.25.9.250/rh6.5/HighAvailability
gpgcheck=0
[LoadBalancer](負載均衡)
name=localserver
baseurl=http://172.25.9.250/rh6.5/LoadBalancer
gpgcheck=0
[ResilientStorage]
name=localserver
baseurl=http://172.25.9.250/rh6.5/ResilientStorage
gpgcheck=0
[ScalableFileSystem]
name=localserver
baseurl=http://172.25.9.250/rh6.5/ScalableFileSystem
"rhel-source.repo"25L, 464C
原來只有第一個,最後幾個是要加的。
1.基本配置
在兩臺節點端(server2、server3)安裝ricci(以下操作都是在兩個節點上同時進行)
yum installricci –y
安裝完之後一般會生成/etc/cluster這個目錄,在這個目錄中會有cluster.conf和cman-notify.d。如果沒有的話,可能是因爲沒有cman這個包,把它按上。yum install cman –y
chkconfig riccion 設置ricci開機啓動
/etc/init.d/riccistart 開啓ricci
echo westos |passwd –stdin ricci 給ricci密碼(一定要有否則將認證失敗)
在管理機|控制端(servser1)中安裝luci
yum install luci-y
/etc/init.d/lucistart 開啓luci
開啓最後一行會出現一個地址,在wed端登錄着個地址
用root登錄
然後添加節點
注:如果出現問題提示你創建的集羣存在,而你又想用該名字,那就進入/etc/cluster/中把cluster.conf刪掉重新弄
出現如下錯誤:
可以看出是server中cman開啓失敗,所以在servser2中執行
/etc/init.d/cmanstart
弄好之後會出現下列情況
此時luci管理端正在爲ricci的HA節點上自動安裝所需要的包
完成後圖形端:
在字符界面輸入clustst會看到節點顯示爲online
2.fence(柵)設備的配置
Fence設備是RHCS集羣中必不可少的一個組成部分,通過fence設備可以避免因出現不可預知的情況而造成“腦裂”現象,fence設備的出現,就是爲了解決類似這些問題,fence設備主要就是通過服務器或存儲本身的硬件管理接口,或者外部電源管理設備,來對服務或存儲直接發出硬件管理指令,將服務器重啓或關機,或者與網絡斷開連接。
Fence的工作原理是:當意外原因導致主機異常或者宕機時,備機會首先調用fence設備,然後通過fence設備將異常主機重啓或者從網絡隔離,當fence操作成功執行後,返回信息給備機,備機在接到fence成功的信息後,開始接管主機的服務和資源。這樣通過fence設備,將異常節點佔據的資源進行了釋放,保證了資源和服務始終運行在一個節點上。
在本次試驗中使用物理主機作爲fence設備。
選擇fencedevices並命名
在物理主機(fencce設備)中安裝下列軟件
然後執行fence_virtd–c(fence_virtd)
直接空格
實驗中寫的是br0
高亮的文件要自己事先建立好,之後空格y就好
下面幾步不是很懂,照着做就了。
往兩個節點中也拷貝入fence_xvm.key拷到/etc/cluster下(server2和server3)
在物理主機(fence設備)中開啓fence_virtd服務
然後查看fence端口開了沒(1229)
然後添加fence設備(注意虛擬機的主機名與虛擬機名字要對應,最好使用id)
然後添加第二個fence設備
後面的和添加第一個一樣
然後檢驗fence設計是否成功
停掉server2之後如果出現 fenceserver2.example.com success並且server2虛擬機重啓的話,fence就設置成功。
3.添加錯誤域(失效轉移):兩個服務同時支持一個掛後之後另一個補上
Failover:又稱故障切換,指系統中其中一項設備或服務失效而無法運作時,另一項設備或服務即可自動接手原失效系統所執行的工作。
進入之後點Add增加
Priority:爲優先級,越小優先級越高
Restricted:該服務只能在該節點中
No Failback:爲服務不切回(默認爲切回),就是指當壞掉的節點號了時,服務切不切回。一般只有當原來節點的性能大於備用節點的性能時,才切回。當兩個節點的性能差不多時,一般不切回。
4.添加資源:
這個ip是一個虛擬的浮動ip,用於外界訪問。當外界訪問的是哪一個節點時,該ip就在哪個節點上。如果該節點壞掉之後,另一個節點頂上的話,該ip就出現在頂替的節點上。(將會浮動出現在後端提供服務的HA節點上;最後一行的數字越小,浮動ip切換的速度越快。)
httpd服務必須是自己在HA節點上提前安裝,但不要啓動(在節點上不要開啓httpd服務)。(這一步我不知道幹嘛)
5.添加服務組:
選擇你剛剛添加的錯誤組的名字
然後點選擇剛剛寫的浮動ip與httpd
然後繼續點,不要點
這次點浮動ip
然後可以看到
(網絡資源)
可看見集羣自己自動將192.268.122.34(浮動ip,按本次試驗的話應該是在server1上啓動了)上的httpd啓動了。
注:後面的截圖因爲老師的機子出問題,所以重新安裝了虛擬機。Sever11和server12爲節點,server3爲服務端。
在server11上配置測試頁。
在server12上配置測試頁。
在server12上clustat查看集羣狀態可以看到現在是server11在進行服務。
在server11上 ip addrshow 可以看出除了server11原來的ip之外server11上還有浮動ip。
6.測試
我們可以使server掛掉,然後看服務是不是轉移到server上了
(1)把server的網斷掉
再繼續通過clustat查看集羣服務狀態,可以看到server12頂替了server11。同時浮動ip也會出現在server12上。可以用 ip addrshow查看。
(2)可以通過內核奔潰
266張