安裝Tensorflow-Gpu Keras-GPU NVIDIA 驅動

我用的版本配置:

Tensorflow-GPU==1.15.0+db2   Keras-GPU==2.2.4

通過一下命令查詢 可以安裝的tensorflow-gpu 的版本及資源路徑

使用conda 查詢可安裝包

按照路徑進行安裝對應的安裝包,這樣比不寫路徑裝速度更快,並且可以查到。

詳細查詢

進行安裝

conda install --channel https://conda.anaconda.org/Databricks/tensorflow-gpu=1.15.0+db2

目前還在看怎麼使用GPU進行訓練模型。

其實使用conda 安裝Tensorflow-GPU的時候已經自動安裝了cudatoolkit 以及 cudnn

我還不知道怎麼用。

面我說一下顯卡的驅動安裝  親測的成功過程

1.首先

查詢自己顯卡對應的驅動版本:  https://www.nvidia.com/Download/index.aspx?lang=en-us

2. 下載 .run 文件

3. 卸載原先所有跟nvidia相關的所有驅動

#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*
 
#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-440.36.run --uninstall

4. 禁用nouveau:

sudo gedit /etc/modprobe.d/blacklist.conf

 在最後一行加入

blacklist nouveau 

之後執行

sudo update-initramfs -u
電腦重啓之後執行
lsmod | grep nouveau  #沒有輸出,即說明安裝成功

 注: 之後安裝可能出現 pre-install script failed 錯誤, 我說明一下,只要你正常按照操作流程,去除了驅動,就沒問題,這是nvidia 工程師開的玩笑,目的是確認你真是要按照這個 哈哈。

5. 下面進行安裝驅動

首要要進入命令行模式,這裏我建議再用一個電腦,或手機來查看教程。

Ctrl-Alt+F1,之後輸入用戶名和密碼登錄即可。            (Alt + F7   又可以回到桌面)

給驅動run文件賦予執行權限:

cd Downloads
sudo chmod a+x NVIDIA-Linux-x86_64-440.36.run

安裝:

sudo ./NVIDIA-Linux-x86_64-440.36.run –no-opengl-files

這裏可能會出現 Error: You appear to be running an X server; please exit X before.......

解決辦法:

Ctrl-Alt+F2  

切換到根權限:

su - root

輸入  init 3 進入文本模式,   這樣就關閉了一切圖形界面

然後再執行上面說的安裝命令。

過程就下面這樣

6.  重啓電腦   掛載驅動  驗證

reboot 命令  重啓電腦

掛載驅動

modprobe nvidia

驗證

nvidia-smi

完成。

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章