win10配置深度學習環境CUDA9.0+cuDNN7.1.4+tensorflow+keras

注:本文默認你已經安裝好python,本文配置深度學習前的環境如下:

  • python3.6
  • win10 64位
  • GeForce GTX980Ti

1、安裝CUDA

深度學習庫如果使用CUDA進行GPU加速,可以大大縮短計算時間。

1.1 檢查GPU是否支持CUDA

先確定下自己的顯卡型號(不要告訴我你不知道怎麼查看自己的顯卡型號)。安裝CUDA前先檢查下,自己的顯卡是否支持CUDA,可以從下面的網址查看自己的顯卡是否在支持之列。
如果你的顯卡比較新,到這裏檢查是否支持CUDA:https://developer.nvidia.com/cuda-gpus

如果你的顯卡很老,請到如下鏈接檢查是否支持CUDA:https://developer.nvidia.com/cuda-legacy-gpus

注意筆記本和desktop的區別。

剛開始我以爲我機器的顯卡不支持安裝CUDA,檢查後發現可以支持,計算性能5.2,感覺應該還可以,但肯定比不了GTX1080Ti的顯卡,查了一下最新的顯卡排行,如下圖所示:

這裏寫圖片描述

發現本機顯卡只比GTX1070的顯卡稍遜一點,居然還是高端顯卡,訓練個模型肯定不成問題了,就是時間稍慢一些。

1.2 下載CUDA

從CUDA官網選擇對應系統下載並安裝文件,地址:https://developer.nvidia.com/cuda-downloads?target_os=Windows

注意Installer Type選擇exe(local)本地安裝,exe(network)聯網安裝可能會發生各種問題,下載步驟如下圖:

這裏寫圖片描述

下載好後一路默認安裝就好了。此處我安裝的是CUDA9.2版本。

PS. 安裝CUDA時想都沒想就安裝了最新版CUDA9.2,到最後才發現TensorFlow框架不支持9.2版本,目前支持最高版本爲CUDA9.0,新手安裝的時候直接安裝9.0版本即可,下文會寫我怎麼解決的問題。

2、測試CUDA安裝結果

打開命令提示符,輸入:nvcc -V,可看到如下信息,代表安裝成功。

這裏寫圖片描述

3、下載cuDNN

安裝好CUDA後其實已經可以使用GPU提速了,但cuDNN可以在前面GPU加速基礎上大概再提升1.5倍的速度,它同樣也是由NVIDIA開發。

cuDNN下載地址:https://developer.nvidia.com/rdp/cudnn-download

在下載cuDNN時,看其他博文說下載該文件需要在NVIDIA官網註冊,我這裏試了很久,都沒有註冊成功,不知道是因爲官網出現了什麼問題,還是國內的原因,我感覺是後者,總之沒註冊成功。

但遇到問題總需要解決,這裏給沒註冊成功的朋友分享一個下載cuDNN的方法:

(1)打開cuDNN各個版本的下載網址:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse51b

(2)然後選擇你需要的版本,比方說選擇cuDNN v7.1.4 Library for Windows 10,這裏千萬不要點擊鏈接,否則會進入註冊界面,而是右鍵選擇“複製鏈接地址”

(3)打開迅雷等下載軟件,添加任務將複製的鏈接地址輸入進去,然後下載,下載速度還是比較快的

(4)下載後是一個壓縮包,如果發現後綴名不是壓縮包的格式,手動改一下

本文下載的是CUDA9.2對應的cuDNN7.1.4版本

4、配置cuDNN

下載好cuDNN後,解壓cudnn-9.2-windows10-x64-v7.1.zip,把解壓包中bin,include,lib裏面的文件(共三個)分別拷貝到CUDA安裝路徑下的bin,include,lib目錄下,即C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\下的bin,include,lib目錄下即可。

5、安裝深度學習框架

pip安裝TensorFlow命令:pip install tensorflow-gpu

pip安裝Keras命令:pip install keras

6、測試配置環境

在程序中輸入import tensorflow as tf

測試一下tensorflow庫是否安裝成功,其他庫類似。發現出錯,如下圖:

這裏寫圖片描述

出現CUDA版本兼容錯誤,由於裝的是最新版的CUDA,而tensorflow目前只支持到9.0版本,所以下載9.0版本的CUDA並安裝:https://developer.nvidia.com/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
cuDNN重新配置對應版本。本文只重裝了CUDA9.0,未重新配置cuDNN,重新測試,運行成功,沒錯誤。

小技巧

如果你在配置的時候不清楚你安裝的TensorFlow版本目前支持CUDA和cuDNN的版本是多少,可以先安裝好TensorFlow庫後,從安裝的TensorFlow庫文件夾中(C:\Users\Administrator\AppData\Roaming\Python\Python36\site-packages\tensorflow\python\platform)找到build_info.py文件,裏面寫着CUDA和cuDNN的版本,從代碼中可以看到:
cuda_version_number = ‘9.0’
cudnn_version_number = ‘7’
我們按照這個版本號安裝就不會出現各種各樣的問題了

雖然build_info.py文件顯示cudnn的版本是7,但根據本文配置的環境CUDA9.0+cuDNN7.1.4,發現只要cuDNN大版本是TensorFlow庫要求的版本就可以。

最後可以愉快的使用GPU訓練模型了,附上訓練模型圖一張

這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章