ubuntu16.04 配置顯卡驅動+cuda8.0+cudnn+pytorch
1. 在線安裝顯卡驅動
1.ubuntu桌面左上角設置 -> system setting -> software&apdates -> additional drivers -> using NVIDIA binary driver
2.安裝完以後 終端輸入nvidia-smi
驗證驅動是否裝好
2. 離線安裝cuda
1找到 cuda_8.._linux.run
和 cuda_8..._375.26_linux.run
所在文件夾
2. 鍵入 ctrl+ shift +F1 進入命令行界面,輸入sudo service lightdm stop
關閉圖形界面。
3. 在命令行界面輸入sudo bash cuda_8_.._375.26_linux.run
注意: 在安裝過程中,會詢問是否需要裝顯卡驅動 輸入 n (避免重複安裝顯卡驅動), 其餘都選y
4.安裝完以後, 輸入 ls
可以查看文件列表,通過sudo bash ***.run
在執行安裝另一個 cuda文件,一直 enter 直到安裝完成
5.啓用圖像界面 sudo service lightdm start
即可進入
3. 安裝cudnn
- 進入cudnn官網,登錄後點擊 Downloadcudnn 下載cuDNN v7.1.3 for CUDA 8.0中的對應16.04的3個Deb文件.(也可以通過
.tzr
文件安裝,但我更偏向用deb
文件,比較方便。
(若已下載,直接在文件所在文件夾打開終端進行第2步驟) - 下載完以後點擊下載頁面的 Installation Guide 按照2.3.2的方法進行安裝
sudo dpkg -i libcudnn7_7
(Tab鍵)
sudo dpkg -i libcdnn7-dev
(Tab鍵)
sudo dpkg -i libcdnn7-doc
(Tab鍵)
注:在終端下,通過tab
鍵可以快速補全,避免輸入錯誤
4. 配置環境變量
1.終端輸入sudo gedit /etc/profile
在末尾加入
PATH=/usr/local/cuda-8.0/bin:$PATH
export PATH
然後保存
2.保存後,創建鏈接文件
sudo gedit /etc/ld.so.conf.d/cuda.conf
增加下面一行
/usr/local/cuda-8.0/lib64
然後在終端輸入sudo ldconfig
使鏈接生效。
5. 離線安裝cond
打開 anaconda所在文件 打開終端 輸入 bash Anaconda3-5.1.0-linux-x86_64.sh
注意:VScode 輸入no
6. 配置pytorch
若是在線安裝打開終端,輸入 conda install pytorch torchvision -c pytorch
若是已下載好pytorch文件,離線安裝,打開離線包所在地,打開終端,輸入 pip install torch-***.whl
(Tab鍵)
並通過pip install
方式安裝torchvision.
注:推薦採用離線安裝方式
7. 測試pytorch
在終端窗口中輸入
import torch
torch.cuda.is_available()
如果出現的是True
就說明已成功安裝好了pytorch並正確識別了cuda
8. 感悟
Cuda是NVIDIA公司用於顯卡計算支持的一個開發庫,而Cudnn是在Cuda的基礎上,爲了深度學習而開發的運行庫,其本質就是.h
頭文件,.lib
和.dll
(Windows下)和.so
(Linux下)的一系列的庫。我們配置cuda和cudnn,除了安裝的過程,就是修改系統的環境變量path以及建立各種鏈接,使得能夠被識別的過程。
修改環境變量的方式不止一種,其實我個人更習慣於在.bashrc
中修改,完成後保存並通過source .bashrc
生效的方式,這一種和上面所寫的方法,就體驗上而言並無本質差別,具體的可以自行百度Linux環境變量。
另外,pytorch
是一個簡潔的深度學習框架,相比起來tensorflow
,我感覺pytorch
更適合用來做學術。而隨着caffe2
的代碼全部併入pytorch
,我堅信pytorch
會越來越火。其識別和調用顯卡,也是要根據系統的環境變量和各種鏈接去找到。
深度學習不易,且行且珍惜。