本文主要記錄如何在 Google 雲服務器上配置遠程深度學習環境,對於單機同樣也適用。
本文翻譯自: TensorFlow_GPU+ubuntu16.04
服務器環境:
系統環境: Ubuntu 16.04
硬件環境: Intel(R) Xeon(R) CPU @ 2.30GHz 內存 : 16G GPU: Tesla K80
安裝完後具備的環境:
1. Ubuntu 16.04
2. cuda 9.0 驅動
3. miniconda 環境 (python 3.6)
4. Tensorflow_gpu 版本
Step 0 : 在開始之前需要關閉 NVIDIA 驅動 nouveau
Method 1:
SSH 連接到服務器後,創建文件:
vi /etc/modprobe.d/nouveau
在創建的文件中鍵入:
blacklist nouveau
options nouveau modeset=0
之後 重啓系統 reboot
系統啓動後,確認 nouveau 已經關閉 (當輸入以下命令後,沒有任何反應,則表示已經關閉該驅動):
lsmod | grep nouveau
Method 2:
在命令行中輸入以下命令刪除原生NVIDIA 驅動:
sudo apt-get purge nvidia*
sudo reboot
Step 1 安裝 Cuda 9.0
1)進行系統升級:
sudo apt-get update
2)安裝相關依賴包
sudo apt-get install openjdk-8-jdk git python-dev python3-dev python-numpy python3-numpy build-essential python-pip python3-pip python-virtualenv swig python-wheel libcurl3-dev curl
3)安裝NVIDIA 驅動
3.1 下載驅動:
curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
3.2 下載安裝 key:
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
3.3 安裝下載的deb包:
sudo dpkg -i ./cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
3.4 採用 apt 方式安裝cuda 9.0:
sudo apt-get update
sudo apt-get install cuda-9-0
3.5 安裝完成後重啓系統:
reboot
3.6 檢測NVIDIA 顯卡驅動是否安裝: 如果安裝完成,則會看到GPU列表
nvidia-smi
Step 2 安裝 Cudnn 9.0
1) 獲得安裝包 :
wget https://s3.amazonaws.com/open-source-william-falcon/cudnn-9.0-linux-x64-v7.1.tgz
2) 解壓
sudo tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
3) 將cudnn 文件拷貝到 cuda 安裝目錄 :sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
4) 將cuda目錄添加到 ~/.bashrc 中 :
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda
5)更新 ~/.bashrc :
source ~/.bashrc
Step 3 安裝 Miniconda 並 創建 conda 環境
1) 下載miniconda 並安裝 :
wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# press s to skip terms
# Do you approve the license terms? [yes|no]
# yes
# Miniconda3 will now be installed into this location:
# accept the location
# Do you wish the installer to prepend the Miniconda3 install location
# to PATH in your /home/ghost/.bashrc ? [yes|no]
# yes
2) 更新 ~/.bashrc :
source ~/.bashrc
conda create -n tensorflow python=3.6
激活 conda 環境:
source activate tensorflow
4)安裝 GPU 版本 TensorFlow:
pip install tensorflow-gpu
到這裏基本上就安裝完畢了,現在進行測試一下:
5) 測試:
python
import tensorflow as tf
constant = tf.constant('Hello Tensorflow')
with tf.Session() as sess:
print(sess.run(constant))
如果沒有彈出錯誤,則表明該環境安裝成功!