NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver

問題描述:

Ubuntu裝好CUDA之後過段時間輸入

$nvidia-smi

查看自己的顯卡信息時,結果報錯:

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

解決辦法:

一、用下面命令先掛載驅動,

modprobe nvidia

再用

nvidia-smi

檢查是否加載成功,不成功的話採用下面的辦法

二、重裝Nvidia驅動

第一步:卸載原驅動

$sudo apt-get remove nvidia-*
$sudo apt-get autoremove

第二步:重新安裝Nvidia驅動

# 以NVIDIA官方網站上的下載鏈接和安裝文件名爲準

wget https://cn.download.nvidia.cn/tesla/384.183/NVIDIA-Linux-x86_64-384.183.run

sudo sh NVIDIA-Linux-x86_64-384.183.run

安裝過程忘了截圖,自己選吧,基本一路yes,最後有個警告。(PS:找不到路徑時,可以按這個提示修復吧(未證實))

                           

第三步:查看Nvidia驅動是否安裝成功

      當安裝完成後,運行下面的命令就可以看到該實例的GPU了。

nvidia-smi

                            

 

 

參考:

【1】Ubuntu 16.04 nvidia-smi報錯(重裝Nvidia驅動)

【2】AWS使用(四)——CUDN安裝及對應tensorflow-gpu版本查找

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章