Ubuntu16.04搭建GXT1080+CUDA+cuDNN+Anaconda3+Tensorflow-GPU(詳細圖文教程)

     剛開始安裝的時候也是入坑無數,找了好多資料安裝好了後面也出現了一些問題;現在總結一下我自己的安裝方法,爲自己的系統以後出問題了方便找資料,也爲了後面的小夥伴安裝搭建環境有個參考,我們開始安裝吧。

 

    步驟一:安裝完雙系統,開機的第一件事就是安裝nvidia顯卡

直接在終端依次執行以下命令:

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

sudo apt-get install nvidia-384#(以前安裝的是390,自己可以在後面選擇需要的版本)

sudo apt-get install mesa-common-dev

sudo apt-get install freeglut3-dev

 說明:在2019.12.1號爲了給Jetson TX2刷機,把系統搞崩了,不得不重新裝了一次,順便走一遍以前的安裝方法;上面的方法到進行到第三個命令就開始報錯了!!!順便改改這篇博客。

現在有一種簡單的方式我直接貼上一張圖就明白了;我選擇了nvidia-384這個。

安裝完成之後reboot一下,重啓之後在終端輸入nvidia-smi驗證一下,查看顯卡信息。

   

    步驟二:安裝CUDA-9.0

1、CUDA的安裝比較容易,官網下載9.0版本,選擇對應系統,請下載runfile

2、在下載文件夾終端輸入:

sudo sh cuda_9.0.176_384.81_linux.run

 剛開始一直顯示的是0%,按q退出文件說明,然後關鍵的地方來了,先輸入accept,接着問你要不要安裝CUDA自帶的顯卡;這一個選擇NO,後面3個都是YES。(忘記截圖了)

 3、安裝完成之後需要配置環境變量   

       在終端輸入:

sudo gedit   ~/.bashrc

     會打開一個文件,在這個文件的最後加入以下兩行內容:

export  PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}

export  LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

   可以直接複製粘貼過去,然後點擊保存或者輸入:

source  ~/.bashrc

     在profile中也輸入上面兩行聲明

sudo gedit    /etc/profile

保存退出,reboot一下。

 4、驗證CUDA版本:9.0

       在終端輸入:nvcc -V

    步驟三:安裝cuDNN

1、在官網下載,需要註冊賬號,目前提供的不同版本爲:

看圖選版本,千萬千萬別選錯!!!

      這裏選擇cuDNN v7.05[Dec 5,2017],for CUDA9.0;

      我自己安裝的是cuDNN  v7.0.5 Library for Linux,這裏看自己喜歡什麼版本吧;

      但是,CUDA-9.0版本的必須和cuDNN的7.0的版本對應起來。cuDNN版本不能超過7.4頭腦發熱裝了cnDNN版本7.6.4的,後面就出問題了,要改!!!),否則後面安裝tensorflow-gpu會報錯,親測要報錯!!!

下面的cuDNN安裝教程就將就看吧,因爲安裝錯了版本,有幾張圖用的是cnDNN7.6.4.38的截圖。

(然後下面是卸載我安裝錯的cuDNN版本,淚奔!乖乖的安裝回原來的版本。)

sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*

2、在下載路徑解壓文件,複製到本地路徑,這裏解壓出來的文件名比較重要

      在下載路徑打開終端依次執行以下命令:

tar -zxvf cudnn-9.0-linux-x64-v7.6.4.38.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

 

3、到我們本地的cuda路徑,進入lib64文件夾會有剛剛解壓的文件,然後在終端打開依次執行以下命令:

cd /usr/local/cuda/lib64

sudo chmod +r libcudnn.so.7.0.5

sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7

sudo ln -sf libcudnn.so.7 libcudnn.so

sudo ldconfig

在本地cuda路徑檢測一下,在終端輸入:ll

安裝成功會出現以下信息:

 

    步驟四:安裝Anaconda3

1、Anaconda 安裝包可以到 清華源下載;也可以去官網下載 官網

      找到自己需要安裝的Anaconda3的版本。

2、本次使用的是Anaconda3-5.2.0-Linux-x86_64.sh

       到下載路徑在終端打開,執行以下命令:

bash Anaconda3-5.2.0-Linux-x86_64.sh 

  按q跳過介紹,輸入yes

回車:

直到顯示安裝完成。

安裝完成以後在終端輸入:conda list   檢測是否安裝成功。

 

    步驟五:安裝TensorFlow-gpu

1、因爲Python3.6版本的也可以用,對於有強迫症的我選擇了安裝

      添加源並更新命令行:

sudo add-apt-repository ppa:fkrull/deadsnakes

sudo apt-get update

      安裝指定版本的python:

 sudo apt-get install python3.6 python3.6-dev

2、我只用了pip安裝,源碼安裝太麻煩沒有采用

       安裝pip:

sudo apt-get install python3-pip

       更新pip:

 pip install   --upgrade pip

3、利用pip來安裝tensorflow-gpu

pip install tensorflow-gpu   #(默認下載最新的版本)
pip install tensorflow-gpu==1.6.0  #(下載1.6版本的,想下載哪個版本自己定)

4、測試是否安裝成功

我的第一次導入報錯了,接着再導入就成功了;

查閱資料才知道原因是:

h5py新版本對numpy1.14版本的兼容錯誤

解決辦法:

pip install h5py==2.8.0rc1

 果然消失了。

 

 

                                                         總結

       現在軟硬件更新太快了,以後系統出問題了估計這個方式也不能用了!所以有安裝不上的小夥伴可以留下腳印,大家一起研究交流,共同學習,一起進步。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章