注:本文默認你已經安裝好python,本文配置深度學習前的環境如下:
- python3.6
- win10 64位
- GeForce GTX980Ti
1、安裝CUDA
深度學習庫如果使用CUDA進行GPU加速,可以大大縮短計算時間。
1.1 檢查GPU是否支持CUDA
先確定下自己的顯卡型號(不要告訴我你不知道怎麼查看自己的顯卡型號)。安裝CUDA前先檢查下,自己的顯卡是否支持CUDA,可以從下面的網址查看自己的顯卡是否在支持之列。
如果你的顯卡比較新,到這裏檢查是否支持CUDA:https://developer.nvidia.com/cuda-gpus
如果你的顯卡很老,請到如下鏈接檢查是否支持CUDA:https://developer.nvidia.com/cuda-legacy-gpus
注意筆記本和desktop的區別。
剛開始我以爲我機器的顯卡不支持安裝CUDA,檢查後發現可以支持,計算性能5.2,感覺應該還可以,但肯定比不了GTX1080Ti的顯卡,查了一下最新的顯卡排行,如下圖所示:
發現本機顯卡只比GTX1070的顯卡稍遜一點,居然還是高端顯卡,訓練個模型肯定不成問題了,就是時間稍慢一些。
1.2 下載CUDA
從CUDA官網選擇對應系統下載並安裝文件,地址:https://developer.nvidia.com/cuda-downloads?target_os=Windows
注意Installer Type選擇exe(local)本地安裝,exe(network)聯網安裝可能會發生各種問題,下載步驟如下圖:
下載好後一路默認安裝就好了。此處我安裝的是CUDA9.2版本。
PS. 安裝CUDA時想都沒想就安裝了最新版CUDA9.2,到最後才發現TensorFlow框架不支持9.2版本,目前支持最高版本爲CUDA9.0,新手安裝的時候直接安裝9.0版本即可,下文會寫我怎麼解決的問題。
2、測試CUDA安裝結果
打開命令提示符,輸入:nvcc -V,可看到如下信息,代表安裝成功。
3、下載cuDNN
安裝好CUDA後其實已經可以使用GPU提速了,但cuDNN可以在前面GPU加速基礎上大概再提升1.5倍的速度,它同樣也是由NVIDIA開發。
cuDNN下載地址:https://developer.nvidia.com/rdp/cudnn-download
在下載cuDNN時,看其他博文說下載該文件需要在NVIDIA官網註冊,我這裏試了很久,都沒有註冊成功,不知道是因爲官網出現了什麼問題,還是國內的原因,我感覺是後者,總之沒註冊成功。
但遇到問題總需要解決,這裏給沒註冊成功的朋友分享一個下載cuDNN的方法:
(1)打開cuDNN各個版本的下載網址:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse51b
(2)然後選擇你需要的版本,比方說選擇cuDNN v7.1.4 Library for Windows 10,這裏千萬不要點擊鏈接,否則會進入註冊界面,而是右鍵選擇“複製鏈接地址”
(3)打開迅雷等下載軟件,添加任務將複製的鏈接地址輸入進去,然後下載,下載速度還是比較快的
(4)下載後是一個壓縮包,如果發現後綴名不是壓縮包的格式,手動改一下
本文下載的是CUDA9.2對應的cuDNN7.1.4版本
4、配置cuDNN
下載好cuDNN後,解壓cudnn-9.2-windows10-x64-v7.1.zip,把解壓包中bin,include,lib裏面的文件(共三個)分別拷貝到CUDA安裝路徑下的bin,include,lib目錄下,即C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\下的bin,include,lib目錄下即可。
5、安裝深度學習框架
pip安裝TensorFlow命令:pip install tensorflow-gpu
pip安裝Keras命令:pip install keras
6、測試配置環境
在程序中輸入import tensorflow as tf
測試一下tensorflow庫是否安裝成功,其他庫類似。發現出錯,如下圖:
出現CUDA版本兼容錯誤,由於裝的是最新版的CUDA,而tensorflow目前只支持到9.0版本,所以下載9.0版本的CUDA並安裝:https://developer.nvidia.com/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
cuDNN重新配置對應版本。本文只重裝了CUDA9.0,未重新配置cuDNN,重新測試,運行成功,沒錯誤。
小技巧
如果你在配置的時候不清楚你安裝的TensorFlow版本目前支持CUDA和cuDNN的版本是多少,可以先安裝好TensorFlow庫後,從安裝的TensorFlow庫文件夾中(C:\Users\Administrator\AppData\Roaming\Python\Python36\site-packages\tensorflow\python\platform)找到build_info.py文件,裏面寫着CUDA和cuDNN的版本,從代碼中可以看到:
cuda_version_number = ‘9.0’
cudnn_version_number = ‘7’
我們按照這個版本號安裝就不會出現各種各樣的問題了
雖然build_info.py文件顯示cudnn的版本是7,但根據本文配置的環境CUDA9.0+cuDNN7.1.4,發現只要cuDNN大版本是TensorFlow庫要求的版本就可以。
最後可以愉快的使用GPU訓練模型了,附上訓練模型圖一張