剛開始安裝的時候也是入坑無數,找了好多資料安裝好了後面也出現了一些問題;現在總結一下我自己的安裝方法,爲自己的系統以後出問題了方便找資料,也爲了後面的小夥伴安裝搭建環境有個參考,我們開始安裝吧。
步驟一:安裝完雙系統,開機的第一件事就是安裝nvidia顯卡
直接在終端依次執行以下命令:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-384#(以前安裝的是390,自己可以在後面選擇需要的版本)
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev
說明:在2019.12.1號爲了給Jetson TX2刷機,把系統搞崩了,不得不重新裝了一次,順便走一遍以前的安裝方法;上面的方法到進行到第三個命令就開始報錯了!!!順便改改這篇博客。
現在有一種簡單的方式我直接貼上一張圖就明白了;我選擇了nvidia-384這個。
安裝完成之後reboot一下,重啓之後在終端輸入nvidia-smi驗證一下,查看顯卡信息。
步驟二:安裝CUDA-9.0
1、CUDA的安裝比較容易,官網下載9.0版本,選擇對應系統,請下載runfile
2、在下載文件夾終端輸入:
sudo sh cuda_9.0.176_384.81_linux.run
剛開始一直顯示的是0%,按q退出文件說明,然後關鍵的地方來了,先輸入accept,接着問你要不要安裝CUDA自帶的顯卡;這一個選擇NO,後面3個都是YES。(忘記截圖了)
3、安裝完成之後需要配置環境變量
在終端輸入:
sudo gedit ~/.bashrc
會打開一個文件,在這個文件的最後加入以下兩行內容:
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
可以直接複製粘貼過去,然後點擊保存或者輸入:
source ~/.bashrc
在profile中也輸入上面兩行聲明
sudo gedit /etc/profile
保存退出,reboot一下。
4、驗證CUDA版本:9.0
在終端輸入:nvcc -V
步驟三:安裝cuDNN
1、在官網下載,需要註冊賬號,目前提供的不同版本爲:
看圖選版本,千萬千萬別選錯!!!
這裏選擇cuDNN v7.05[Dec 5,2017],for CUDA9.0;
我自己安裝的是cuDNN v7.0.5 Library for Linux,這裏看自己喜歡什麼版本吧;
但是,CUDA-9.0版本的必須和cuDNN的7.0的版本對應起來。cuDNN版本不能超過7.4(頭腦發熱裝了cnDNN版本7.6.4的,後面就出問題了,要改!!!),否則後面安裝tensorflow-gpu會報錯,親測要報錯!!!
下面的cuDNN安裝教程就將就看吧,因爲安裝錯了版本,有幾張圖用的是cnDNN7.6.4.38的截圖。
(然後下面是卸載我安裝錯的cuDNN版本,淚奔!乖乖的安裝回原來的版本。)
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
2、在下載路徑解壓文件,複製到本地路徑,這裏解壓出來的文件名比較重要
在下載路徑打開終端,依次執行以下命令:
tar -zxvf cudnn-9.0-linux-x64-v7.6.4.38.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
3、到我們本地的cuda路徑,進入lib64文件夾會有剛剛解壓的文件,然後在終端打開依次執行以下命令:
cd /usr/local/cuda/lib64
sudo chmod +r libcudnn.so.7.0.5
sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
在本地cuda路徑檢測一下,在終端輸入:ll
安裝成功會出現以下信息:
步驟四:安裝Anaconda3
1、Anaconda 安裝包可以到 清華源下載;也可以去官網下載 官網
找到自己需要安裝的Anaconda3的版本。
2、本次使用的是Anaconda3-5.2.0-Linux-x86_64.sh
到下載路徑在終端打開,執行以下命令:
bash Anaconda3-5.2.0-Linux-x86_64.sh
按q跳過介紹,輸入yes
回車:
直到顯示安裝完成。
安裝完成以後在終端輸入:conda list 檢測是否安裝成功。
步驟五:安裝TensorFlow-gpu
1、因爲Python3.6版本的也可以用,對於有強迫症的我選擇了安裝
添加源並更新命令行:
sudo add-apt-repository ppa:fkrull/deadsnakes
sudo apt-get update
安裝指定版本的python:
sudo apt-get install python3.6 python3.6-dev
2、我只用了pip安裝,源碼安裝太麻煩沒有采用
安裝pip:
sudo apt-get install python3-pip
更新pip:
pip install --upgrade pip
3、利用pip來安裝tensorflow-gpu
pip install tensorflow-gpu #(默認下載最新的版本)
pip install tensorflow-gpu==1.6.0 #(下載1.6版本的,想下載哪個版本自己定)
4、測試是否安裝成功
我的第一次導入報錯了,接着再導入就成功了;
查閱資料才知道原因是:
h5py新版本對numpy1.14版本的兼容錯誤
解決辦法:
pip install h5py==2.8.0rc1
果然消失了。
總結
現在軟硬件更新太快了,以後系統出問題了估計這個方式也不能用了!所以有安裝不上的小夥伴可以留下腳印,大家一起研究交流,共同學習,一起進步。