nvidia+cuda+cudnn安裝

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

看到上面這個該死的語句不知道怎麼回事真是日了狗,本來程序跑的好好的,學長後臺有個compize的進程佔滿cpu後就出現這個tmd該死的情況,我tm心態都爆炸了,試着解決一下,真tm日了狗!!!!!!!!!!!

首先看看怎麼按nvidia驅動
linux nvidia驅動安裝
上面這個教程tm的不太詳細,首先要看對應顯卡型號,這樣才能找到對應的顯卡驅動,不然該死的匹配不對的話,可能會卡死。
用這個命令查看顯卡型號:

lshw -numeric -C display

找到product那一行,雖然我知道顯卡型號,但爲了保證這個該死的帖子能記錄到很詳細,我還是把流程記錄一下:

product: NVIDIA Corporation [10DE:1B02]

這個該死的型號是16進制的,用如下網站可以查詢:

http://pci-ids.ucw.cz/mods/PC/10DE/1B02

在這裏插入圖片描述
知道該死的型號後去看看該死的對應的驅動
查看顯卡對應驅動
然後發現可以安裝440,ok進行該死的下一步:

在我不懈的搜索下終於找到一套完整的安裝流程,先mark一下:
pytorch環境搭建

# 添加ppa源並安裝最新的驅動
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
ubuntu-drivers devices
sudo apt install nvidia-driver-440
# 爲了防止自動更新驅動導致的兼容性問題,我們還可以鎖定驅動版本:
sudo apt-mark hold nvidia-driver-440
# nvidia-driver-440 set on hold.

但是我銬,該死的軟件列表裏沒有440只有該死的430,所以只能該死的換另一個方法直接從該死的官網下載run文件,然後看看linux自帶的驅動禁止了沒:

lsmod | grep nouvea

ok試着裝一下:
錯誤提示要關掉x服務,好像是桌面圖形什麼的。
但是./run文件的時候報錯,真是不出意外啊,到處是坑,看看美國老哥的解決方案:

# To stop:
sudo service gdm stop
# To start:
sudo service gdm start

發現沒用,那估計是另一個服務了:

sudo stop lightdm

看看行不行,該死的不行換個命令

sudo service lightdm stop

好像可以了,看看能不能裝上驅動
在這裏插入圖片描述
ok裝上了
cuda+cudnn安裝教程
接下來裝cuda,我選擇了10.1版本
在這裏插入圖片描述
好像pytorch1.4不支持10.2

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章