在VMSKY上看到一編好文,特轉來存檔. A. 檢查軟件兼容性 vCenter Server軟件版本號必需高於/等於置管ESX的版本 ; vSphere Client軟件版本號必需高於/等於被訪問的vCenter版本; vSphere Client軟件版本號必需高於/等於被訪問的ESX版本 ; 在使用Update Manager時必需保持vCenter、vSphere Client、Update Manager這三者的版本是一致的。 更多VI 架構組件的兼容性請查閱使用文檔與以下軟件兼容手冊: vSphere Compatibility Matrix http://www.vmware.com/resources/compatibility/docs/vSphere_Comp_Matrix.pdf VMware Infrastructure Compatibility Matrixes http://www.vmware.com/pdf/vi3_35/esx_3/r35/vi3_35_25_compat_matrix.pdf
B.
檢查網絡:
1.使用PING命令測試網絡連接,如果PING命令測試不成功。請檢查:
vCenter與ESX所在的Vlan
檢查vCenter和ESX的網關與網絡配置
物理鏈路檢查
2.
檢查虛擬交換機配置
esxcfg-vswitch –l
esxcfg-vswif –l
esxcfg-nics –l
3.
檢查服務器端口開放情況
查看ESX防火牆端口開放:esxcfg-firewall –q
查看服務器端口使用情況netstat -na
4.
檢查物理交換機QOS配置
5.
vCenter到ESX的網絡是否經過NAT地址轉換
C.
檢查存儲狀態,ESX是否BOOT FROM SAN
檢查存儲連接
vSphere Client –Configuration-Storage Adaptes
vSphere Client –Configuration-Storage
執行”esxcfg-mpatch -l”查看已連接的存儲
執行”esxcfg-scsidevs –l”,查看已簽名的SCSI設備
確認存儲空間
在ESX執行”vdf -h”檢查各分區存儲使用情況
vSphere 4服務控制檯的文件系統
查看存放Service Console的虛擬磁盤
#vsd –l
vsa0:0:0
/dev/sda
查找Service Console的VMDK路徑
#vsd –g
/vmfs/volumes/*/esxconsole-*/esxconsole.vmdk
D.
vCenter與ESX配置檢查:
1.
vCenter與ESX系統的配置會影響到程序的正常運行
檢查/etc/hosts文件的默認記錄是否存在(hosts文件中127.0.0.1該條系統自帶解析記錄不可刪除)
127.0.0.1
localhost.localdomain localhost
2.
查看HOSTD與VPXA進程是否正在運行
#ps –ef | grep hostd
#ps –ef | grep vpxa
(如果HOSTD與VPXA程序沒有在運行,可直接執行以下命令啓動:
啓動HOSTD:
# /bin/sh /usr/bin/vmware-watchdog -s hostd -u 60 -q 5 -c /usr/sbin/vmware-hostd-support /usr/sbin/vmware-hostd /etc/vmware/hostd/config.xml –u
啓動VPXA
#/bin/sh /opt/vmware/vpxa/bin/vmware-watchdog -s vpxa -u 30 -q 5 /opt/vmware/vpxa/sbin/vpxa
3.
重新啓動HOSTD與VPXA檢查程序是否異常
#service mgmt-vmware restart
#service vmware-vpxa restart
(重啓如果提示如下,說明重啓服務正常
[root@vsphere1 ~]# service mgmt-vmware restart
Stopping VMware ESX Management services:
VMware ESX Host Agent Watchdog
[
OK
]
VMware ESX Host Agent
[
OK
]
Starting VMware ESX Management services:
VMware ESX Host Agent (background)
[
OK
]
Availability report startup (background)
[
OK
]
[root@vsphere1 ~]# service vmware-vpxa restart
Stopping vmware-vpxa:
[
OK
]
Starting vmware-vpxa:
[
OK
])
它們的工作目錄在/etc/init.d/,如果不能正常啓動服務請查看KB :http://kb.vmware.com/kb/ 1003490
4.審覈vpxa代理配置文件:
文件地址:/etc/opt/vmware/vpxa/vpxa.cfg
5.審覈hostd配置文件:
文件地址:/etc/vmware/esx.conf
6.在vCenter指定管理ESX的地址
Vi client—login to vCenter—Administration—vCenter Server Settings—Runtime Settings—Managed IP Address—vCenter Server Managed IP:
7.檢查vCenter的SSL驗證
Vi client—login to vCenter—Administration—vCenter Server Settings—SSL Settings—去掉”vCenter requires verified host SSL certificates”的勾選。
綜上:如果仔細檢查並執行以上每一項沒有問題,但是ESX在vCenter中狀態依舊不正常,請執行以下操作:
1.使用VI Client連接到vCenter
2.停止該cluster的 HA與DRS
3.右鍵有故障的ESX -> Disconnect -> 再次右鍵將該ESX從vCenter上移除
4.使用root用戶登錄到ESX執行以下操作
i.執行命令停止系統管理服務的運行
service mgmt-vmware stop
service vmware-vpxa stop
ii.刪除vpxa Agent程序
rpm –qa |grep vpxa
rpm –e <上一條指令返回的結果>
iii.將vpxa舊的配置文件改名
Esx 3.5 配置文件的路徑
mv /etc/opt/vmware/vpxa/vpxa.cfg /etc/opt/vmware/vpxa/vpxa.cfg.old
Esx 4.0 配置文件的路徑
mv /etc/opt/vmware/vpxa/vpxa.cfg /etc/opt/vmware/vpxa/vpxa.cfg.old
5.登錄ESX 的命令行終端:
#service iptables stop
# chkconfig --level 35 iptables off
6. service mgmt-vmware start
7.重新將ESX添加到vCenter
8.啓用HA與DRS
最後,官方解決方案:
http://kb.vmware.com/kb/1003409