Windows+tensorflow+CUDA搭建GPU加速環境

寫在前面

在搭建GPU加速環境時遇到了各種各樣的坑,在此記錄僅供他人蔘考和自己回顧。雖然網上有各種各樣的教程,但是個人感覺講的不是很明白,在這裏想再理理思路。

坦白說,起初連什麼是GPU加速都不太清楚,經過一番查閱瞭解才大致有個印象,有了一個整體思路的話,搭建環境會快很多,在搭建過程中,一定要時刻注意版本的對應

CUDA

CUDA是英偉達公司推出的一款產品,能夠利用GPU的並行計算引擎,從而能夠解決更加複雜的任務,比如跑深度學習模型,GPU簡直比CPU快了一倍不止。其官方下載地址爲CUDA Tookits下載下載之前一定要先瞭解到自己的環境,是Windows還是Linux,是哪一個版本,一定要確定好了再下載,否則很浪費流量、浪費精力!
CUDA下載頁
確定好自己的環境之後進行下載。下載後打開進行安裝(建議不要修改路徑),如下圖
在這裏插入圖片描述
等一個進度條之後就可以進行正常安裝了,按照安裝流程一路“確定”就可以了,其中安裝選項界面用精簡模式即可,比較懂的可以自定義,最終完成CUDA的安裝。
在這裏插入圖片描述
在這裏插入圖片描述
檢驗是否安裝成功的方式:
在CMD命令臺中,用nvcc -V進行測試,出現下圖測試結果即爲安裝成功
在這裏插入圖片描述

cuDNN

這個也是NVIDIA推出的用於深度神經網絡的GPU加速庫,它通常集成在高級別的深度學習庫中,如Caffe、tensorflow、Pythrch等,而tensorflow-gpu就是集成了cuDNN,它通過配置環境變量來調用cuDNN及CUDA。
cuDNN的環境要與CUDA搭配起來,詳情請見Tensorflow不同版本要求與CUDA及CUDNN版本對應關係,選好版本後到官網下載(得註冊賬號)
下載地址:cuDNN
下載好之後,解壓會看到如下圖所示的結果
在這裏插入圖片描述
其中bin和include目錄下都只有一個文件,將文件分別將其拷貝到CUDA的對應的bin和include目錄中(默認CUDA安裝目錄爲C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0),也就是對CUDA做一個補充。
注意:千萬不要把CUDA本身的這三個文件目錄覆蓋,否則你會被坑的很慘(親身經歷),最後將lib目錄下x64中的文件也拷貝到對應的路徑中。如下圖所示
在這裏插入圖片描述
配置環境變量:
將bin目錄、include目錄及lib下的x64目錄添加到系統環境變量path中。
示例如下圖,具體路徑根據自己的環境來
環境變量

tensorflow-gpu

至此外部環境搭建的就差不多了,下面就可以安裝與cuDNN版本對應的tensorflow-gpu庫了,在安裝之前,如果已經安裝了tensorflow,一定要先刪掉(uninstall)這個庫,因爲tensorflow與tensorflow-gpu的目錄文件有重複,會覆蓋tensorflow的部分文件,然後就沒法正常執行程序了。
下載指令pip install tensorflow-gpu或者用conda安裝
版本對應關係仍見Tensorflow與cuDNN版本

環境測試

測試環境是否成功可使用下面的腳本

import os
import tensorflow as tf
import keras.backend.tensorflow_backend as KTF
# 指定第一塊GPU可用
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
config = tf.ConfigProto()
config.gpu_options.allow_growth=True   #不全部佔滿顯存, 按需分配
# config.gpu_options.per_process_gpu_memory_fraction = 0.3
sess = tf.Session(config=config)
KTF.set_session(sess)

運行之後,看到自己的顯卡信息即爲配置成功,正確的執行結果如下圖
在這裏插入圖片描述
可以看到我的Tesla P4 GPU已經跑起來啦,至此環境搭建結束,歡迎繼續交流!

參考文章

  1. Windows10系統下的tensorflow-gpu+CUDA+cuDNN配置
  2. Tensorflow不同版本要求與CUDA及CUDNN版本對應關係
  3. 如何檢查keras / tensorflow是否正在使用cuDNN
  4. 正確的姿勢安裝cudnn
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章