大半夜收到此類信息,應該是讓所有系統管理員最頭大的事情了
首先我快速通過iDRAC,發現服務器發生了重啓操作,並得到相關日誌信息
通過Dell的官方解釋,確定了該問題是OS層面的異常導致。打開Windows Event Log,使用時間&嚴重程度進行篩選,我們發現瞭如下信息:
由此,我猜測此次事故由於0x7a類型的藍屏錯誤導致!爲了證實這種猜想以及繼續分析根本原因,藉助Microsoft提供的Debug工具對DUMP文件進行分析,內容如下:
通過初步bugcheck,基本確定了我的猜測,再結合call stack信息
可以判斷是因爲某個分區被移除導致,接下來再進行深度分析來判斷是哪塊分區被移除以及被移除的原因;
得到如下兩條重要信息:
1、Corruption may occur in VolumeId: C:
2、錯誤值: C000000E、磁盤類型: 0
以此確定C盤發生了狀態碼爲0xC000000E的錯誤,導致此次事件!
結合Microsoft提供的狀態碼說明
可以很明確的判斷是由於硬件及驅動問題導致(爲什麼iDRAC沒有相關報錯???)
最後向Dell提交case,建議對raid卡及磁盤控制器進行升級,希望能徹底解決此問題!
兩點相關話題
1、可以使用Chkdsk命令對系統分區進行檢查,具體命令Chkdsk / f / r c:
2、病毒同樣可以引起藍屏,除了殺毒軟件,我們還可以通過Local Security Authority Process=lsass.exe的啓動位置 來分析,正常情況下,他是由C:\Windows\System32啓動