現場環境:
SUSE9SP3linux +VCS4.1MP4雙機
問題描述:
啓動VCS雙機報錯
#hastart
dNFS_Disks urp9fs3 *FAULTED*
group resource system message
--------------- -------------------- -------------------- --------------------
fs3 STALE ADMIN WAIT: all systems stale
fs4 STALE ADMIN WAIT: all systems stale
日誌DiskReservation_A.log中報錯
2011/05/23 11:57:26 VCS ERROR V-16-10031-2005 DiskReservation:dNFS_Disks:monitor:GETSTAT failed. return=-1, errno=5, scsi=0x10000.
問題處理:
1. 檢查GAB(Group Membership Services/Atomic Broadcast),發現異常,
#/sbin/gabconfig -a
屏幕顯示如下類似信息,
GAB Port Memberships
===============================================================
Port a gen f29111 membership 01
表明雙機心跳不正常,GAB 沒有通過驗證。
重新啓動該服務無效;
2. 檢查心跳地址,可以互相PING通,排除網卡問題;
3. 重新啓動服務器後檢查GAB已經恢復正常。
#/sbin/gabconfig -a
屏幕顯示如下類似信息,表明雙機心跳正常,GAB 通過驗證。
GAB Port Memberships
===============================================================
Port a gen f29111 membership 01
Port h gen f29113 membership 01
4.啓動雙機依然報同樣錯。檢查配置發現多出一個.stale文件,正常情況下此文件是不存在的(stale表示過期)
5,刪除.stale文件後重啓雙機可正常啓動。