HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

HP DL380G9 iLO降級(Degrated)及存儲失敗(storage Failed)報錯如何處理?

©Lander Zhang 專注外企按需IT基礎架構運維服務,IT Helpdesk 實戰培訓踐行者
http://blog.51cto.com/lander
2018/09/7 7:30

問題描述

某沙特公司搭建的虛擬化環境中有一臺ESXi主機報Storage Fialed警告但是仍能正常運行,通過iLO登陸主機後發現System Health: Critical, iLO Heath: DegradedStorage Failed :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

點擊 System Health 看到提示 Storage: Failed:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

點擊 Failed 查看具體情況: logical Driver 01 - Failed 邏輯磁盤狀態失敗;Physical Driver OK 物理磁盤狀態是好的。
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

點擊 iLO 看到提示 Controller Firmware revsion 2.10 Embeded media manager failed initialization:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

問題分析

客戶採用的是傳統虛擬化架構,使用EMC共享存儲虛擬機,主機上只安裝了ESXi,標配2塊SAS 300G硬盤做了RAID1。與客戶IT溝通澳洲公司之前也發生類似的問題,後來把服務器的BIOS固件升級到最新就解決問題了。與DELL售後聯繫回覆說這是兩個問題,他們之間沒有必然聯繫要分開來解決。

問題1:iLO的報錯,可以嘗試升級服務器BIOS到最新版本看問題是否解決。

問題2:Storage Failed,從報錯看可能是有人重新插拔了硬盤導致磁盤陣列出問題了,可能需要備份數據然後重建RAID。

解決方法

1.客戶IT下載並升級BIOS到最新,我們再次查看時Storage報錯依舊,iLO的報錯信息變化爲 Controller firmware revision 2.10.00 NAND write fuilure :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

2.升級BIOS沒有生效,嘗試重啓主機看是否能解決問題:
2.1 將主機置於維護模式:登陸vCenter,右擊故障主機 - Enter Maintainace Mode :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

勾選 Move powered off and suspended virtual machines to other hosts in the cluster - Yes :
勾選這個選項後自動將這臺主機上所有虛機轉移到其他集羣的主機上:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

看到故障主機已經處於維護模式下了,這種模式下主機不參與虛擬環境下的HA等高級功能特性:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

2.2 通過iLO遠程控制檯登陸故障主機,關閉ESXi系統:
Remote Console - Launch -Run :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

輸入ESXi主機用戶名和密碼登陸ESXi主機:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

按F11重啓主機:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

2.3 重啓後顯示兩條報錯,無法繼續啓動系統,同時F10的功能禁用沒有顯示出來:
Embeded RAID1 : ......

338-HPE RESTful API Error - Unable to communicate with iLO FW. BIOS configuration resources may not be update-to-date.
Action: Restore Manufacturing Defualts in RBSU.
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

2.4 致電DELL被告知需要首先排除iLO的故障然後再處理Storage的故障。對於iLO當前錯誤提示,嘗試關機放電操作,如果還是不行,可能需要更換主板。

關機放電操作步驟:在控制檯裏關閉電源 - 拔掉所有外接電源線 - 靜置5分鐘徹底放電 - 再連上電源線開機 - 啓動後iLO報錯消失,F10選項出現 - iLO故障解決:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

3.解決Storage報錯。
3.1 在2.4步驟下,按 F10:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

等待初始化網絡並自動會跳過:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

選擇 Perform Maintenance :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

Smart RAID/HBA Controllers - Smart Array P440ar - Configure :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

Controller Devices - Logical Devices - Logical Driver 1 - Re-enable Failed Logical Drive - Yes - Finish :
重新修復失敗的陣列,如果修復成功就不需要重建RAID,ESXi主機就不用重裝安裝了。
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

點擊 X - OK 退出配置界面:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

點擊右上角電源按鈕在彈出的對話框中選擇 Reboot :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

系統重啓在BIOS界面,按 F11 選擇啓動項:
不手動選擇的話,默認先從PXE IPv4 IPv6等啓動,然後反覆這樣就是不能自動從RAID1上的邏輯盤上啓動。
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

選擇 Embeded RAID 1: ...... :
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

至此ESXi順利啓動到正常運行狀態:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

4.登陸到vCenter查看,故障主機已經恢復正常:
HP DL380G9 iLO降級Degrated及存儲失敗storage Failed報錯如何解決?

如果文檔對你有用,煩請轉發分享!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章