HP-UX MC/SG報錯一例分享

環境:HPUX 11.31;ServiceGurad A.11.20。2個node:node1,node2;一個package:pkg1.

 

主機:BL860c i4

 

故障現象:pkg1可以正常的在兩個node之間切換,但是當其中一個node關機後,pkg1切到node2上只能運行1分鐘左右,之後便會自動failed。

 

分析過程:

 

        1.檢查了pkg1的log,系統的syslog,均未發現異常。

 

        2.檢查配置在pkg控制文件裏的應用腳本,未發現異常。爲了方便排查,暫時將定義在control文件裏的應用腳本註釋掉。

 

        3.註釋掉之後,故障現場仍然存在。肩擦包配置文件,包控制文件,依然沒有什麼發現。

 

        4.檢查集羣配置文件,和以往自己做的集羣配置文件進行對比,發現客戶的集羣配置文件裏多了SUBNET配置和IP_MONITOR配置。懷疑是

 

此原因,故將其註釋,如下:

 

#SUBNET 10.73.0.0

#  IP_MONITOR OFF

#  POLLING_TARGET 10.73.0.1 

 

       5.重新check,apply集羣配置文件後,故障解決。

 

總結:經過查證,在集羣配置文件裏(一般爲cluster.ascii)不需要寫SUBNET參數(在pkg配置文件裏寫入MONITORED_SUBNET即可),也不需要IP_MONITOR參數,如果寫了SUBNET,則一定要把IP_MONITOR 設置爲OFF。

 

      對於這種故障,解決方法爲:A.註釋掉集羣配置文件裏的SUBNET參數和IP_MONITOR參數。2.如果不註釋,在一定要把IP_MONITOR配置爲OFF。推薦方法A。IP監控的配置在包配置文件裏可以定義,不用再在集羣裏定義。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章