深度學習環境配置tensorflow+cuda9.1+cudnn-v7.1

首先是這次配置的所有軟件:
ubuntu16.04
anaconda3
tensorflow_gpu
cuda9.1+cudnn-v7.1

一、安裝 Anaconda

詳細閱讀下載此官網對應python版本的anaconda
https://docs.anaconda.com/anaconda/faq#id5

建立一個 conda 計算環境

爲了管理多個環境, 那麼我們至少要有兩個環境, 以便能夠進行移除或者切換.
命令行進入到Anaconda3-5.0.1-Linux-x86_64.sh文件所在的路徑下後執行:

sudo bash Anaconda3-5.0.0-Linux-x86_64.sh

一路繼續,注意中間有一處可以修改安裝路徑的地方。

Anaconda3 will now be installed into this location:
/home/zerozone/anaconda3
- Press ENTER to confirm the location
- Press CTRL-C to abort the installation
- Or specify a different location below
- [/home/zerozone/anaconda3] >>> /你的路徑

這一步不會出太大的問題。

激活環境,使用 conda 安裝 TensorFlow-gpu 這裏有一個坑!!!!!

 conda create -n tensorflow python=3.5

1、如果你已經安裝或準備安裝cuda9.1 ,需要看此步,否則跳到第2步
!!目前官方的tensorflow發行還不支持cuda9.1
不過有大神編譯好了,這裏有非官方的支持cuda9.1和cudnn7.1的預編譯版TensorFlow。
https://github.com/mind/wheels/releases/
下載好後進入目錄繼續:

sudo aptitude install python3-pip
pip3 install 上面下載的 .whl 文件

安裝好後自行測試tensorflow
2 、正常安裝移步官網
https://www.tensorflow.org/install/install_linux?hl=zh-cn#gpu_support

pip install --ignore-installed --upgrade \
> https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.6.0-cp35-cp35m-linux_x86_64.whl

CUDA+cuDNN安裝

1、進入官網,下載並根據知道安裝9.1版本
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=deblocal

一般會將工具安裝到諸如 /usr/local/cuda 之類的路徑.

2、下載並安裝 CUDNN
若是向我一樣官網註冊不了。這裏有備份
鏈接: https://pan.baidu.com/s/1DiQYF8KFnuwfVDnmlxBw7w 密碼: ga6s

解壓並拷貝 CUDNN 文件到 安裝路徑下. 假設 Cuda 安裝 在 /usr/local/cuda, 在下載位置執行以下命令:

tar xvzf cudnn文件
sudo cp cudnn-。。。/cudnn.h /usr/local/cuda/include
sudo cp cudnn-。。。/libcudnn* /usr/local/cuda/lib64

此外還需要設置 LD_LIBRARY_PATH 和 CUDA_HOME 環境變量. 可以考慮將下面的命令 添加到 ~/.bash_profile 文件中, 這樣每次登陸後自動生效. 注意, 下面的命令 假定 CUDA 安裝目錄爲 /usr/local/cuda:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME=/usr/local/cuda

至此就可以測試tensorflow gpu環境了。
經過一天多的安裝,結合參考才過了一些坑。寫下來記錄和參考。

主要參考:

完整教程:
http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html#install_cuda
https://www.tensorflow.org/install/install_linux?hl=zh-cn#gpu_support

Ubuntu16.04下Anaconda3的安裝:
https://blog.csdn.net/ksws0292756/article/details/79143460
conda 環境操作 :
https://blog.csdn.net/simple_the_best/article/details/74351769

更新!!!測試後發現會在運行跑網絡時 kernel died 的情況。又重新換成了 cuda9.0+cudnn-v7.0

在卸載 cuda9.1時由於是deb安裝 找不到.pl文件
找到方法

sudo apt-get remove cuda-*

cuda9.0 官網可下,這次下deb安裝很不順利,下載慢

sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-rc_9.0.103-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local-rc/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

安裝失敗後 下載runflie文件安裝


sudo bash cuda_9.0.176_384.81_linux-run

安裝過程需要輸入一些確認選項,過程如下:

Description

The NVIDIA CUDA Toolkit provides command-line and graphical
tools for building, debugging and optimizing the performance
Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n

Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/cqc ]: 

Installing the CUDA Toolkit in /usr/local/cuda-9.0 ..

cudnn-v7.0 還是因爲註冊不了 不能下載。 找了好久

鏈接: https://pan.baidu.com/s/1L_xKd2dlR5-tQX41wvKluQ 密碼: u53u

ok 一切照常。。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章