本博主也是第一次玩linux服務器,所以配置tensorflow環境也是用了兩天,現在就來說說本博主成功的配置過程,已便大家參考
一、安裝Ubuntu16.04
二、安裝ssh
三、安裝顯卡驅動
默認安裝的顯卡驅動不是英偉達的驅動,所以先把舊得驅動刪除掉。
sudo apt-get purge nvidia*
添加Graphic Drivers PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
查看合適的驅動版本:
ubuntu-drivers devices
圖中可以看出推薦的是最新的415版本的驅動,安裝該驅動:
sudo apt-get install nvidia-driver-415
安裝完畢後重啓機器:
sudo reboot
重啓完畢運行
nvidia-smi
看看生效的顯卡驅動:
安裝依賴庫
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-devlibgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
不過本人有一個庫沒有安裝成功
libxi-devlibgl1-mesa-glx
不過不用管這個庫,繼續下面的步驟
GCC降低版本
CUDA9.0要求GCC版本是5.x或者6.x,其他版本不可以,需要自己進行配置,通過以下命令纔對GCC版本進行修改。
- 版本安裝
# 版本安裝:
sudo apt-get install gcc-5
sudo apt-get install g++-5
- 通過命令替換掉之前的版本
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
四.安裝CUDA9.0
- 版本選擇:
linux--x86-64,Ubuntu--17.04,runfile(local),下載Base Installer和4個Patch
備註:如果下載不方便,本文末尾處提供百度雲下載。
下載進入目錄後,依次執行命令:
注意:在安裝過程中會提示是否需要安裝顯卡驅動,在這裏要選擇n,其他的選擇y或者回車鍵進行安裝:
chmod +x cuda_10.0.130_410.48_linux.run
1
執行安裝包,開始安裝:
./cuda_10.0.130_410.48_linux.run
1
開始安裝之後,需要閱讀說明,可以使用Ctrl + C直接閱讀完成,或者使用空格鍵慢慢閱讀。然後進行配置,我這裏說明一下:
(是否同意條款,必須同意才能繼續安裝)
accept/decline/quit: accept
(這裏不要安裝驅動,因爲已經安裝最新的驅動了,否則可能會安裝舊版本的顯卡驅動,導致重複登錄的情況)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?(是否安裝CUDA 10 ,這裏必須要安裝)
(y)es/(n)o/(q)uit: y
Enter Toolkit Location(安裝路徑,使用默認,直接回車就行)
[ default is /usr/local/cuda-10.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?(同意創建軟鏈接)
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?(不用安裝測試,本身就有了)
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...(開始安裝)
- 在~/.bashrc 中設置環境變量:
sudo vi ~/.bashrc
exportPATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
exportLD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
運行
source ~/.bashrc
使其生效,最好重啓一下。
sudo reboot
重啓後,測試CUDA是否成功(此步驟可以省略)
nvcc -V
出現上圖的樣例,就成功了
五.安裝CUDNN
官網:https://developer.nvidia.com/rdp/cudnn-download
進入CUDNN 7.1 for CUDA 9.0三個文件所在的目錄,執行如下命令安裝:
cd ~/tools/cudnn/7.1_for_cuda9.0
sudo dpkg -i libcudnn7_7.1.4.18-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.1.4.18-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.1.4.18-1+cuda9.0_amd64.deb
驗證CUDNN 7.1 for CUDA 9.0是否安裝成功
使用如下命令將示例代碼複製到當前用戶目錄,編譯並運行其中的一個示例程序mnistCUDNN:
cp -r /usr/src/cudnn_samples_v7/ ~
cd ~/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
六.安裝Tensorflow GPU 1.8
由於Anaconda可以提供完整的科學計算庫,所以直接使用Anaconda來進行相關的安裝。
1)安裝Anaconda
下載地址:https://www.anaconda.com/download/
備註:如果下載不方便,本文末尾處提供百度雲下載。
這裏我們下載Python 3.7 64bit 的Anaconda3-5.3.0-Linux-x86_64.sh,直接安裝即可。
bash Anaconda3-5.3.0-Linux-x86_64.sh
2)更改pip和conda爲國內的源
由於國內訪問pip和conda比較慢,建議更改爲國內的源:
a.更改pip的源爲阿里雲:
mkdir ~/.pip
cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF
b.更改conda的源爲清華大學:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
3)在Anaconda中安裝Python3.6的虛擬環境
由於Anaconda的python版本是3.7的,TensorFlow尚不支持此版本,於是我們創建一個Python的虛擬環境
conda create --name tf python=3.6 #創建tf環境
虛擬環境主要命令:
source activate tf #激活tf環境
source deactivate tf #退出tf環境
conda remove --name tf --all #刪除tf環境(全部刪除)
4)在Anaconda中安裝TensorFlow GPU 1.8
pip install --ignore-installed --upgrade tensorflow-gpu
將會自動安裝如下組件:
numpy 、wheel 、tensorflow-tensorboard 、six、protobuf 、html5lib 、markdown、werkzeug 、bleach、setuptools
5)使用下列代碼測試安裝正確性
命令行輸入:
source activate tf
python
Python命令下輸入以下代碼:
import tensorflowas tf
hello= tf.constant('Hello, TensorFlow!')
sess= tf.Session()
print(sess.run(hello))
沒有報錯就是配置好了。
七.安裝Keras
直接在這個虛擬環境中安裝:
pip install keras
八.安裝Pytorch
直接在這個虛擬環境中安裝:
conda install pytorch torchvision -c pytorch
測試Pytorch是否安裝成功:
命令行輸入:
source activate tf
python
python命令下輸入以下代碼:
import torch
print(torch.cuda.is_available())
返回True說明安裝成功了。
最後大家可以參考這幾位大佬的博客
https://zhuanlan.zhihu.com/p/50302396
https://blog.csdn.net/zx_good_night/article/details/80243881