ibm服務器面板報警指示燈含意

EVENT LOG指示燈報警

有臺IBM服務器前面的光通路面板開始亮起了小黃燈,推出這個小盒子一看,是EVENT LOG指示燈報警。一時不知道是什麼原因,可能是日誌錯誤,要進Configuration 去調一下,於是打800電話,硬件工程師聽了我的問題後,說應該是日誌文件滿了,應清空一下,開機啓動時,看到提示按F1進Configuration中把兩個日誌文件都清一下,我問怎麼會滿呢?他說只能存512條日誌文件,多了就因覆蓋不了前面的日誌文件而報警,按他的方法在F1進入的 Configuration/Setup Utility中,選擇POST Error Log選項後,直接回車選擇Clear error logs清除所有的自檢日誌,同樣選擇System Error Log,直接回車選擇Clear error logs清除所有的系統日誌,一切OK(注:不同機型可以會略有不同,如3550只有system Error log選項,如果清除完後仍亮黃燈,建議斷電幾分鐘再開機試試,如果問題還沒有解決,那可能是硬件有問題了,請跟IBM售後聯繫!)。

PS2指示燈報警

IBM的解釋是這個PS2不是PS2接口,而是服務器電源

DASD指示燈報警

7月21日下午檢查機房設備時,發現一臺IBM x3650服務器0號硬盤黃燈閃爍,前面板“!”紅色警示燈亮,操作系統運行正常。打開“Light Path“面板,發現”DASD“燈亮,上網搜索了一下得知DASD(Direct Access Storage Device)燈亮是硬盤背板故障。這臺服務器才運行一年多時間啊,不會這麼快就壞吧。趕緊撥打IBM 800報修電話,描述完故障,客服人員做好記錄後說呆會有工程師回電。可1個多小時過去了還沒接到回電(當時心裏不是很爽),於是又撥通了IBM報修熱線,這回接電話的是另外一位工程師,瞭解故障情況後,答覆:黃燈閃爍是硬盤在同步數據,同步完成會熄滅,DASD燈亮需作測試報告以進一步確定故障原因,有可能要對機器作微碼升級,讓我先做好數據備份,並將測試步驟以及所需測試軟件發到我的郵箱。
  下午快下班的時候,0號硬盤×××故障燈果然熄滅恢復正常,但DASD故障燈仍亮,這樣看來,0號硬盤本身應該沒什麼問題,故障可能真的出在硬盤背板上。不管怎麼樣,先將數據備份至另外一臺服務器上。備完數據,按照IBM郵件裏的處理步驟,進行DSA動態系統診斷,並將生成的診斷報告回覆給IBM。
  7月23日下午3:30,BE準時到現場。我詢問到底是什麼故障?答覆升級微碼後應該能解決問題,至於要不要更換硬盤背板還要看升級後的情況。接下去就是一系列的微碼升級工作,包括主板BIOS、RAID卡等等。升級完成後,DASD故障燈果然熄滅,服務器看似恢復正常了。由於此前0號硬盤有報警,於是按Ctrl+A進入Array Controller對0號硬盤進行掃描檢測,結果一切正常,排除了硬盤故障。硬盤背板是否正常,現在也不能下定論,工程師讓我再觀察幾天,暫時不換備件。
    下午2點,BE帶着備件準時到場重新接回線纜、蓋上機蓋、開機、進入系統,一切常,               
              故障排除了,也留下許多疑問。如果確實是硬盤背板問題,爲什麼微碼升級過後就恢復正常了?如果背板是好的只是單純微碼升級問題,爲什麼故障在機器運行一年多後纔出現?這些疑問BE沒有當場給我答覆,讓人納悶。希望有同樣經歷的朋友互相交流!

 

ps   指示燈:當此指示燈發亮時,表明電源2 出現故障。

temp 指示燈:當此指示燈發亮時,表明系統溫度超出閾值級別。

fan:當此指示燈點亮時,表明散熱風扇或電源風扇出現故障或運行太慢。風扇發生故障還會導致over temp 指示燈發亮。

link指示燈:當此指示燈發亮時,網卡出現故障。

vrm 指示燈:當此指示燈發亮時,表明微處理器托盤上的某個vrm 出現故障。

cpu 指示燈:當此指示燈發亮時,表明某個微處理器出現故障。

pci 指示燈:當此指示燈發亮時,表明某個pci 總線發生錯誤。

mem 指示燈:當此指示燈發亮時,表明發生內存錯誤。

dasd 指示燈:當此指示燈發亮時,表明某個熱插拔硬盤驅動器出現故障。

nmi 指示燈:當此指示燈發亮時,表明出現一個不可屏蔽中斷(nmi)。

sp 指示燈:當此指示燈發亮時,表明服務處理器遇到錯誤。

brd 指示燈:當此指示燈發亮時,表明某個連接的i/o 擴展單元出現故障。

log 指示燈:當此指示燈發亮時,表明您應該查看事件日誌或remotesupervisor。

cnfg指示燈:當此指示燈發亮時,表明BIOS配置錯誤

raid 指示燈:當此指示燈發亮時,表明陣列卡故障。

over spec 指示燈:當此指示燈發亮時,表明對電源的需求超過了指定的電源供應。

remind 按鈕:按下此按鈕可重新設置操作員信息面板上的系統錯誤指示燈並將服務器置於提醒方式。在提醒方式下,故障並沒有清除但系統錯誤指示燈會閃爍(每2 秒閃爍一次)而不是持續發亮;如果出現另一個系統錯誤,則系統錯誤指示燈將會持續發亮。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章