最近羣裏陸續有人反映vShpere5 HA測試失敗,有物理機環境的,也有Workstation環境下部署的vShpere,症狀都表現爲Slave Host關機時,其上的虛機可以正常切換到另一臺Host啓動,反之則不行。
測試環境:
VMware Workstation 10
vShpere 5.5.0 Build 1331820
DC: 192.168.50.110
ESXi55-1: 192.168.50.61 Gateway和DNS都填寫爲192.168.50.110
ESXi55-2: 192.168.50.62 Gateway和DNS都填寫爲192.168.50.110
vCenter: 192.168.50.63
共享存儲使用Openfiler,這裏不詳述。
虛機win2k8:新建的一個windows虛機的配置文件,並沒有實際安裝系統。
測試流程:
1、win2k8位於ESXi55-2(slave)上,手動關閉ESXi55-2主機電源,觀察虛機情況。
2、win2k8位於ESXi55-1(master)上,手動關閉ESXi55-2主機電源,觀察虛機情況。
測試結果:
關閉Slave Host後,HA自動將win2k8在192.168.50.61上restart
同樣,關閉Master Host後,HA自動將win2k8在192.168.50.62上restart
HA功能測試正常,但是什麼原因造成本文開頭的故障呢?
個人判斷如下:
測試環境中,很多人只是在ESXi中設置了IP地址和掩碼,並未配置可用的網關和DNS,導致HA中主機故障時,無法ping通隔離地址(一般情況下就是是網關IP),觸發隔離響應流程,使虛機無法正常切換。
建議大家在測試HA環境是,搭建一臺windows域控,把HA中所有主機的網關和DNS都指向這個域控的IP,可以避免很多麻煩。