我用的版本配置:
Tensorflow-GPU==1.15.0+db2 Keras-GPU==2.2.4
通過一下命令查詢 可以安裝的tensorflow-gpu 的版本及資源路徑
使用conda 查詢可安裝包
按照路徑進行安裝對應的安裝包,這樣比不寫路徑裝速度更快,並且可以查到。
詳細查詢
進行安裝
conda install --channel https://conda.anaconda.org/Databricks/tensorflow-gpu=1.15.0+db2
目前還在看怎麼使用GPU進行訓練模型。
其實使用conda 安裝Tensorflow-GPU的時候已經自動安裝了cudatoolkit 以及 cudnn
我還不知道怎麼用。
下面我說一下顯卡的驅動安裝 親測的成功過程
1.首先
查詢自己顯卡對應的驅動版本: https://www.nvidia.com/Download/index.aspx?lang=en-us
2. 下載 .run 文件
3. 卸載原先所有跟nvidia相關的所有驅動
#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*
#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-440.36.run --uninstall
4. 禁用nouveau:
sudo gedit /etc/modprobe.d/blacklist.conf
在最後一行加入
blacklist nouveau
之後執行
sudo update-initramfs -u
電腦重啓之後執行
lsmod | grep nouveau #沒有輸出,即說明安裝成功
注: 之後安裝可能出現 pre-install script failed 錯誤, 我說明一下,只要你正常按照操作流程,去除了驅動,就沒問題,這是nvidia 工程師開的玩笑,目的是確認你真是要按照這個 哈哈。
5. 下面進行安裝驅動
首要要進入命令行模式,這裏我建議再用一個電腦,或手機來查看教程。
Ctrl-Alt+F1,之後輸入用戶名和密碼登錄即可。 (Alt + F7 又可以回到桌面)
給驅動run文件賦予執行權限:
cd Downloads
sudo chmod a+x NVIDIA-Linux-x86_64-440.36.run
安裝:
sudo ./NVIDIA-Linux-x86_64-440.36.run –no-opengl-files
這裏可能會出現 Error: You appear to be running an X server; please exit X before.......
解決辦法:
Ctrl-Alt+F2
切換到根權限:
su - root
輸入 init 3 進入文本模式, 這樣就關閉了一切圖形界面
然後再執行上面說的安裝命令。
過程就下面這樣
6. 重啓電腦 掛載驅動 驗證
reboot 命令 重啓電腦
掛載驅動
modprobe nvidia
驗證
nvidia-smi
完成。