ubuntu下安裝配置 tensorflow-gpu

配置環境之前要做的工作是知道自己的顯卡信息,然後再去官網下載對應版本NVIDIA版本驅動

1、查看顯卡信息

nvidia- smi

2、下載對應版本顯卡驅動

NVIDIA驅動下載鏈接 https://www.nvidia.cn/Download/index.aspx?lang=cn

3、禁用開源nouveau驅動

1)打開終端,先刪除舊的驅動:

sudo apt-get purge nvidia*

2)禁用自帶的 nouveau nvidia驅動

lsmod | grep nouveau

3)創建一個文件

sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

4)添加如下內容:

blacklist nouveau
options nouveau modeset=0

5)保存文件退出,執行下面命令更新一下

sudo update-initramfs -u

6)重啓電腦,打開終端再次輸入命令

lsmod | grep nouveau

如果發現什麼都沒顯示,那麼說明禁用nouveau 成功了,

4、安裝NVIDIA顯卡驅動

1)首先按Ctrl+Alt+F1進入控制檯,輸入用戶名密碼登陸,執行下面命令關閉圖形界面

sudo service lightdm stop

然後cd切換到存放顯卡驅動文件的路徑,運行安裝文件:

sudo sh NVIDIA-Linux-x86_64-390.42.run --no-opengl-files

必須加上 --no-opengl-files ,否則會出現循環登錄(登錄之後再退出到登錄界面)

5、網上查找tensorflow-gpu所對應的cuda和cudnn版本關係

在這裏插入圖片描述
tensorflow-gpu 1.4版本爲分界線,需要cuda8 和 cudnn6,tensorflow-gpu 1.5版本以上都需要cuda9和cudnn7

6、cuda下載

下載鏈接
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu

7、安裝cuda

1)按Ctrl+Alt+F1進入控制檯,輸入用戶名密碼登陸,執行命令關閉圖形界面

sudo service lightdm stop

2)跳轉到存放文件的路徑運行安裝文件

sudo sh cuda_9.0.176_384.81_linux.run

3)安裝開始以後,首先是一個協議,一直按空格到底以後,輸入accept。其他的操作如下所示:

Do you accept the previously read EULA?
accept/decline/quit: accept
 
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n
 
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y
 
Enter Toolkit Location
[ default is /usr/local/cuda-9.0 ]:
 
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
 
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y

第二個安裝顯卡驅動一定要選擇no,否則之前安裝的驅動就白裝了,有默認選項的直接選擇默認選項就可以了(直接回車)
4)安裝完成後,打開圖形界面配置環境變量,運行如下命令打開profile文件

sudo service lightdm start   //打開圖形界面
sudo gedit  /etc/profile

5)打開文件後在文件末尾添加路徑,命令如下:

export  PATH=/usr/local/cuda-9.0/bin:$PATH
export  LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH

根據自己安裝的cuda版本,可以將9.0改爲8.0或者10.0, 根據自己安裝的cuda版本來進行更改
6)保存

sudo ldconfig

7)重啓電腦

sudo reboot

8)查看版本

nvcc --version

9)編譯例子測試

cd  /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

8、卸載cuda(可選)

1)如果安裝錯了版本,卸載操作如下:

sudo apt-get remove cuda 

sudo apt-get autoclean

sudo apt-get remove cuda*

2)在目錄切換到/usr/local/下

cd /usr/local/

sudo rm -r cuda-9.2

3)添加下環境變量

sudo gedit ~/.bashrc

4)打開文件後,將下面內容添加到文件的最後面,保存後退出

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

5)設置環境變量和動態鏈接庫

sudo gedit /etc/profile

6)在打開的文件末尾加入:

export PATH=/usr/local/cuda/bin:$PATH

7)創建鏈接文件:

sudo gedit /etc/ld.so.conf.d/cuda.conf

在打開的文件中添加如下語句:

/usr/local/cuda/lib64

8)執行,使鏈接立即生效

sudo ldconfig

9、下載獲取cudnn

下載地址:https://developer.nvidia.com/rdp/cudnn-archive
下載自己對應的CUDA版本的cudnn文件
這裏選擇 cuDNN v7.0.5 Library for Linux
注意:

千萬別選[Power8]的版本,這個是給Power8處理器使用的,由於v7.1.2版本還沒提供普通版本,所以就下載了v7.0.5
這裏下載是需要註冊登陸的

10.安裝cudnn

1)解壓文件cudnn-9.0-linux-x64-v7.tgz,並且複製到cuda路徑中

tar -zxvf cudnn-9.0-linux-x64-v7.tgz
cd cuda    
sudo cp lib64/lib* /usr/local/cuda/lib64/    
sudo cp include/cudnn.h /usr/local/cuda/include/ 

2)更新網絡連接:

cd /usr/local/cuda/lib64/  
sudo chmod +r libcudnn.so.7.0.5  //自己查看.so的版本 對應更改  
sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7  
sudo ln -sf libcudnn.so.7 libcudnn.so  
sudo ldconfig 

3)測試

nvcc -V 

若出現版本信息則表示安裝成功

11、安裝Anaconda

1)下載安裝包
Anaconda 安裝包可以到 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 下載
2)進入到相應文件夾進行安裝

bash ./Anaconda3-5.0.0-Linux-x86_64.sh

3)更改環境變量

sudo gedit ~/.bashrc

在末端輸入

export PATH="/home/coder/anaconda3/bin:$PATH"

4)生效

source ~/.bashrc

4)更換源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

12、卸載Anaconda(可選)

1)刪除整個anaconda目錄:
由於Anaconda的安裝文件都包含在一個目錄中,所以直接將該目錄刪除即可。到包含整個anaconda目錄的文件夾下,刪除整個Anaconda目錄:

rm -rf anaconda文件夾名

2)建議清理下.bashrc中的Anaconda路徑:

到根目錄下,打開終端並輸入:

  sudo gedit ~/.bashrc

在.bashrc文件末尾用#號註釋掉之前添加的路徑(或直接刪除):

export PATH=/your/path/to/anaconda3/bin:$PATH

保存並關閉文件 使其立即生效,在終端執行:

   source ~/.bashrc

3)關閉終端,然後再重啓一個新的終端,這一步很重要,不然在原終端上還是綁定有anaconda.

13、安裝tensorflow

1)建立獨立環境

conda create -n tensorflow python=3.6

2)進入環境

source activate tensorflow

3)安裝

pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple (更換源安裝很快)

4)測試代碼

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))

14、安裝numpy matplotlib pandas

1)進入環境

source activate tensorflow

2)安裝

pip install keras
pip install matplotlib
pip install pandas

3)測試keras

import keras

若出現Using TensorFlow backend 輸出,則說明安裝keras-gpu安裝成功,這是機器上當前GPU設備的情況。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章