實驗室服務器安裝cuda9.0，cudnn，Anaconda，tensorflow-gpu（小白教程）

原創

azeyeazeye

2020-06-14 21:23

昨天的剛接觸服務器，今天就可以跑模型了，還挺爽的。

系統：本地windows，服務器 Centos7 ，64位
安裝包：MobaXterm，cuda9.0，cudnn，Anaconda（資源下載鏈接：https://pan.baidu.com/s/16YbybsV3jTjKDm48tcVg4A
提取碼：ng64 ）

1.安裝MobaXterm

（是自己電腦與服務器遠程連接的可視化軟件，操作簡單），具體看安裝使用教程（試了3種 MobaXterm ，Xshell ，WinSCP，最後發現MobaXterm好用）。 以下幾步操作參考這篇博客【在服務器上安裝tensorflow-gpu版本及其使用】

2.安裝cuda9.0

（一定是要9.0版本，9.2，10.0都是坑，親測無效！）去我的資源下載cuda9.0，（也可自行下載，參見上面博客）上傳至服務器任意位置，然後使用cd到該目錄下

cd /your/save/path

運行命令：

sh cuda_9.0.176_384.81_linux-run

如圖所示

安裝過程中剛開始會出現一大堆類似文檔的東西，瘋狂空格就行

Do you accept the previously read EULA?
accept/decline/quit: accept（沒什麼好說的了直接敲accept）
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.26? 這裏是說是否安裝顯卡驅動，一定要選no！
Do you want to install the OpenGL libraries? 這是nvidia自己的opencv 沒有用的,要用就用直接的opencv官網安裝也很簡單，所以這n
Install the CUDA 9.2 Toolkit? 是否安裝，當然yes
Enter Toolkit Location
default is /usr/local/cuda-9.2 : 這個一定不要用默認的，因爲沒有su權限，目錄選到自己home下例如：/home/wushuai/

配置環境變量：找到.bashrc文件，在最後一行添加

export PATH=/your cuda installation path/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/your cuda installation path/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} 
export CUDA_HOME=/your cuda installation path/ 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/your cuda installation path/extras/CUPTI/lib64

保存即可。（如果找不到.bashrc文件應該是被隱藏了，返回你登錄時的目錄下點一下這個圖標就可以，ps:“your conda installation path”，就是到conda這個文件夾，“/your/save/path”等是指要你改成你的路徑，我曾經看到有人沒改直接就輸入了。。。）

3.安裝cudnn

查看所需cudnn版本，

cat /your cuda installation path/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如圖我的CuDNN版本爲7.3.1,如果你的也是7.3.1去我的資源下載即可，否則自己去官網下載適合自己的版本。

安裝cudnn比較簡單，簡單地說，將cudnn上傳到和cuda同一個目錄下。這樣解壓時，不用自己操作即可將cudnn文件複製到cuda文件夾中。然後複製幾個文件：庫文件和頭文件。將cudnn的頭文件複製到cuda安裝路徑的include路徑下，將cudnn的庫文件複製到cuda安裝路徑的lib64路徑下。具體操作如下

#解壓文件
tar -xzvf cudnn-9.0-linux-x64-v7.3.1.20.tgz

#切換到剛剛解壓出來的文件夾路徑
cd cuda 
#複製include裏的頭文件（記得轉到include文件裏執行下面命令）
sudo cp /include/cudnn.h  /usr/local/cuda/include/
 
#複製lib64下的lib文件到cuda安裝路徑下的lib64（記得轉到lib64文件裏執行下面命令）
sudo cp lib*  /usr/local/cuda/lib64/
 
#設置權限
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
 
#======更新軟連接======
cd /usr/local/cuda/lib64/ 
sudo rm -rf libcudnn.so libcudnn.so.7   #刪除原有動態文件，版本號注意變化，可在cudnn的lib64文件夾中查看   
sudo ln -s libcudnn.so.7.3.1 libcudnn.so.7  #生成軟銜接（注意這裏要和自己下載的cudnn版本對應，可以在/usr/local/cuda/lib64下查看自己libcudnn的版本）
sudo ln -s libcudnn.so.7 libcudnn.so #生成軟鏈接
sudo ldconfig -v #立刻生效

cudnn安裝完畢

4.安裝anacanda3，去我的資源下載anacanda或者去鏡像（推薦清華鏡像）（官網下載的最新版本有坑，慎重，推薦python版本爲3.6的anacanda3，我安裝的是anacanda3-5.3.0），然後上傳至服務器任意位置，然後cd到該目錄下

cd /your/save/path

運行命令：

sh Anaconda3-5.3.0-Linux-x86_64.sh

配置環境變量，找到.bashrc文件，在最後一行添加export PATH="/your anaconda installation path/bin:$PATH"，保存即可。

5.安裝tensorflow-gpu，輸入命令：

pip install tensorflow-gpu

驗證是否安裝成功：

進入python（輸入python即可）

輸入如下代碼

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

下方有大段顯示GPU信息表示安裝成功

至此大功告成！！！

另外有幾點注意：

1.我參考的那篇博客用虛擬環境裝的tensorflow，其實用不用都行，我都試了。激活環境，我沒有切換鏡像，網速慢是個大問題，昨晚到11.30一直下載包失敗，重複好多次，今早七點就起了，重新執行激活環境的命令，網速很快，一會就好了

2.安裝tensorflow-gpu不成功，可能沒指定版本，結果安裝最新的，與cuda版本不配，然後又百度與cuda和cudnn版本對應的tensorflow-gpu版本，重新下載，就成功了。

3.總結一下，成功前提是服務器權限開放，成功經驗是多問問實驗室有經驗的+找靠譜博客

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

實驗室服務器安裝cuda9.0，cudnn，Anaconda，tensorflow-gpu（小白教程）

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

pygame如何在沒有屏幕的情況下訓練

可以實現

實驗室服務器安裝cuda9.0，cudnn，Anaconda，tensorflow-gpu（小白教程）

Win10搭建星際爭霸2SC2LE環境

強化學習——探索與利用基本方法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結