心跳線問題小感悟

公司有一部分數據庫使用的是hpux 10 rac,而且安裝serviceguard。這部分數據庫平時運行的好好的,不過偶然會出現心跳線問題,這個相當困擾,因爲問題不明顯。出現這個問題的時候好像並不影響數據庫的雙機運行?往往是巡檢的時候才發現問題。不知道各位大神能否指點一二

目前我判斷心跳線有問題
1.crs_stat 只有一邊可以刷出
2.crs日誌可以看到心跳線time-out
3.如果有rman或者arch是通過兩邊備份,可以看見備份會出現問題。

這個時候只能手動重啓crs服務了。

出現問題的時候
重啓有問題一邊的crs服務,一般就是crs_stat刷不出的一邊
一般來說重啓都有問題,一般關閉監聽,數據庫,asm實力,然後關crs服務,關不到就kill進程cssd進程,一般kill掉整個服務器會重啓,但是實際中卻會不重啓,推測是serviceguard截住了,如果沒有serviceguard,在測試環境的rac都是會重啓的。

rac博大精深,需多加學習。
發佈了33 篇原創文章 · 獲贊 0 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章