IBM X3850 X5 PCI故障實例

公司有一臺IBM X3850 X5服務器,運行過程中故障面板亮起,查看後發現PCI報錯。整個光通路診斷面板上只有PCI燈在亮,且運行狀態的讀數爲01,證明服務器運行時正常的,只是有小錯誤而已。收集日誌發現如下圖。
IBM X3850 X5 PCI故障實例
首先查到資料,我們51的大神的博客裏提到的相關處理方式嘗試操作了一下,並未產生作用。
http://blog.51cto.com/830629/1722671
仔細分析對比後,發現大神博客裏提到的報錯爲:
1.A software NMI has occurred on system
2.Fault in slot "All PCI Err" on system
而我遇到的故障報錯多了一條
1.A software NMI has occurred on system
2.Fault in slot "All PCI Err" on system
3.a uncorrectable bus error has occurred on system
莫非就這一條差別造成方法不同?查詢後指向了IO板或者微碼,於是決定從刷微碼開始進行。
將服務器數據備份後,重啓進入IMM,依次刷了IMM UEFI FPGA微碼,重啓後,服務器恢復正常。(在刷IMM微碼時,服務器是關機狀態,刷新完成後故障已經消除。爲了安全,又開機將另外兩個微碼全部刷新)
總體來說是比較順利的,可以看得出,這一條錯誤可以認爲是系統誤報或者說是系統BUG,並未對硬件產生影響。以上就是故障處理過程,希望對大家有所幫助。微碼我會放在我的下載裏面,需要的朋友可以隨時去下。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章