現象
內核中出現下面的消息: pcie04: Card not present on Slot
排查過程
確認哪個PCIE slot
lspci -vvvv -s 0000:ac:00.0 看看是什麼PCI bus:
看看它下掛什麼設備
在異常的節點上看看:
在正常的同類型節點上看它掛載什麼設備
確認它是什麼設備
lspci -vvvv -s af:00.0
可以看到這個是NVME controller , 顯然是掛的是一塊NVME 盤。後面通過在正常、異常節點上 比較mount/fdisk -l 的輸出,確認異常節點上確實少一塊盤。
總結
當我們碰到內核中異常PCIE 的信息的時候,需要結合PCIE 拓撲結構,定位到具體PCIE卡設備,確認其類型,然後通過系統命令確認。