Ubuntu16.04 配置GPU 深度學習環境

本文主要記錄如何在 Google 雲服務器上配置遠程深度學習環境,對於單機同樣也適用。 

本文翻譯自: TensorFlow_GPU+ubuntu16.04

服務器環境:

系統環境:  Ubuntu 16.04

硬件環境:  Intel(R) Xeon(R) CPU @ 2.30GHz   內存 : 16G  GPU: Tesla K80


安裝完後具備的環境: 

1. Ubuntu 16.04 

2. cuda 9.0 驅動

3. miniconda 環境 (python 3.6) 

4. Tensorflow_gpu 版本 

Step 0 :  在開始之前需要關閉 NVIDIA 驅動 nouveau 

Method 1: 

SSH 連接到服務器後,創建文件:

 vi /etc/modprobe.d/nouveau 

在創建的文件中鍵入:

blacklist nouveau
options nouveau modeset=0

之後 重啓系統 reboot 

系統啓動後,確認 nouveau 已經關閉 (當輸入以下命令後,沒有任何反應,則表示已經關閉該驅動): 

lsmod | grep nouveau

Method 2:

在命令行中輸入以下命令刪除原生NVIDIA 驅動: 

sudo apt-get purge nvidia*  
sudo reboot   

Step 1   安裝 Cuda 9.0

     1)進行系統升級: 

sudo apt-get update

    2)安裝相關依賴包

sudo apt-get install openjdk-8-jdk git python-dev python3-dev python-numpy python3-numpy build-essential python-pip python3-pip python-virtualenv swig python-wheel libcurl3-dev curl   

    3)安裝NVIDIA 驅動 

     3.1 下載驅動: 

curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb

    3.2 下載安裝 key:

sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub

    3.3 安裝下載的deb包:

sudo dpkg -i ./cuda-repo-ubuntu1604_9.0.176-1_amd64.deb

    3.4  採用 apt 方式安裝cuda 9.0:

sudo apt-get update
sudo apt-get install cuda-9-0 

    3.5 安裝完成後重啓系統:

reboot

    3.6 檢測NVIDIA 顯卡驅動是否安裝:  如果安裝完成,則會看到GPU列表 

nvidia-smi  

Step 2   安裝 Cudnn 9.0

    1)     獲得安裝包 :

wget https://s3.amazonaws.com/open-source-william-falcon/cudnn-9.0-linux-x64-v7.1.tgz  

    2)    解壓

sudo tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz  
    3)   將cudnn 文件拷貝到 cuda 安裝目錄 :
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

    4) 將cuda目錄添加到 ~/.bashrc 中 :

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda

    5)更新 ~/.bashrc :

source ~/.bashrc

Step 3   安裝 Miniconda 並 創建 conda 環境

1)    下載miniconda 並安裝 :

wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh   
# press s to skip terms   

# Do you approve the license terms? [yes|no]
# yes

# Miniconda3 will now be installed into this location:
# accept the location

# Do you wish the installer to prepend the Miniconda3 install location
# to PATH in your /home/ghost/.bashrc ? [yes|no]
# yes    

2)   更新 ~/.bashrc :

source ~/.bashrc
3) 創建conda環境:
conda create -n tensorflow python=3.6

      激活 conda 環境:

source activate tensorflow 

4)安裝 GPU 版本 TensorFlow:

pip install tensorflow-gpu

到這裏基本上就安裝完畢了,現在進行測試一下:

5) 測試:

python 
import tensorflow as tf 
constant = tf.constant('Hello Tensorflow')
with tf.Session() as sess:
     print(sess.run(constant))
如果沒有彈出錯誤,則表明該環境安裝成功!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章