故障現象
服務器無故的,自動重啓:
可以根據下面的,看到最後一次重啓爲20號的19:55
reboot system boot 3.10.0-327.el7.x Sat Oct 20 19:55 - 06:20 (1+10:25)
故障分析
- 分析服務器日誌
因爲服務器運行,會自動生成系統日誌,所以先查看服務器系統日誌,查看有什麼問題。服務器系統日誌文件路徑及文件爲:
/var/log/messages
找到了下面的問題:
當然,沒看懂,在網上查了下,這個故障是內核報錯:pci的內存無法分配,這樣的問題一般都是內存不兼容或者內存無法識別。
找到這裏,大概可以確定是內存的問題了。
- 根據問題,查找原因
上面已經分析出故障位置了,那就繼續查看內存到底是怎麼回事。
根據查看內存的信息,找到下面的問題:
- 上面的截圖先查看文件是因爲查看內存信息的返回輸出太多,所以我寫入了文件,方便查看。
從截圖內,可以看出,中間是A5-A8的內存插槽內的內存,是系統無法識別的,這樣也符合我們上面在系統日誌內找到的故障原因,那就應該是這裏的問題了。
故障排除
既然上面的問題已經找到了,故障點也確認了,那就直接找到服務器,確定好A5-A8內存插槽,先把內存插拔測試,發現問題解決了。。。