linux服務器重啓分析

linux服務器重啓分析

故障現象

服務器無故的,自動重啓:
在這裏插入圖片描述

可以根據下面的,看到最後一次重啓爲20號的19:55

reboot   system boot  3.10.0-327.el7.x Sat Oct 20 19:55 - 06:20 (1+10:25)

故障分析

  1. 分析服務器日誌

因爲服務器運行,會自動生成系統日誌,所以先查看服務器系統日誌,查看有什麼問題。服務器系統日誌文件路徑及文件爲:

   /var/log/messages

找到了下面的問題:
在這裏插入圖片描述
當然,沒看懂,在網上查了下,這個故障是內核報錯:pci的內存無法分配,這樣的問題一般都是內存不兼容或者內存無法識別。
找到這裏,大概可以確定是內存的問題了。


  1. 根據問題,查找原因
    上面已經分析出故障位置了,那就繼續查看內存到底是怎麼回事。
    根據查看內存的信息,找到下面的問題:
    在這裏插入圖片描述
  • 上面的截圖先查看文件是因爲查看內存信息的返回輸出太多,所以我寫入了文件,方便查看。

從截圖內,可以看出,中間是A5-A8的內存插槽內的內存,是系統無法識別的,這樣也符合我們上面在系統日誌內找到的故障原因,那就應該是這裏的問題了。


故障排除

既然上面的問題已經找到了,故障點也確認了,那就直接找到服務器,確定好A5-A8內存插槽,先把內存插拔測試,發現問題解決了。。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章