使用TensorFlow-GPU的準備工作(我太難了。。)

在安裝了Keras和TensorFlow後跑FCN代碼感覺略慢,然後發現電腦中有NVIDIA的GPU芯片,於是企圖妄想使用TensorFlow-GPU,由此入坑開始了悲慘人生


安裝過程中主要需要注意的有幾點(可能我並沒有弄全)

  • CUDA版本(CUDA的版本有很多,但是最好不要選太高的,選擇太高可能你的NVIDIA不配,或者你的別的哪個安裝包不配,我選擇的是CUDA8.0)
  • CUDNN版本(CUDNN只是一個神經網絡的框架,他需要和CUDA版本匹配,比如我的是CUDA8.0,那麼相應的CUDNN應該是6.0)
  • TensorFlow-GPU版本(如果直接用pip或者conda安裝,會安裝到最新版本,那麼問題來了,版本如果太高,又會和你的CUDA版本不兼容,比如我的CUDA是8.0,那麼我的TensorFlow-GPU的版本應該是小於1.5)
  • Python版本(我的python目前裝的是3.7版本,比較新,然後我想安裝TensorFlow-GPU1.5時候發現安不上,這時候是因爲你的Python版本過高了。真滴是一環套一環)

所以總的順序來講
(1)先查看一下你的電腦的NVIDIA版本後,找一個合適的版本,安裝CUDA驅動軟件(並且安裝好後還要配置環境變量)
(2)安裝CUDNN,要和CUDA匹配着安裝
(3)安裝TensorFlow-GPU,這個也要和CUDA的版本互相匹配着安。
(4)這一步不一定有:如果你發現你安裝不上TensorFlow-GPU,而且是因爲python版本過高,那就再進行python版本的更改替換。
版本的對應關係在後文中會提到,所以,一起開始悲慘吧!

1、檢查NVIDIA版本後安裝CUDA

(1)如何檢查自己電腦的NVIDIA版本
(2)NVIDIA版本對應的CUDA版本(你別安高了)

(3)如何安裝CUDA以及驗證是否安裝成功
(4)安裝CUDA後配置環境變量及驗證
這塊兒我覺着很玄學,網上講的配置環境的步驟有很多,我感覺emmm我貌似也沒怎麼配置嘛(可能是我忘了O(∩_∩)O),我看了一下我的環境變量貌似只有下面這樣(系統變量裏多了這兩條)
在這裏插入圖片描述
需要注意的是,不知道爲何我在C盤打開Program Files後根本找不到NVIDIA GPU Computing Toolkit這個路徑,這裏也很玄學,你只要直接在訪問欄目直接輸入路徑就進去了,難不成這是個寶藏麼。如下:
在這裏插入圖片描述

直接輸入到這兒,然後回車,就到了你的目的地了,之後應該是一個v8.0(這是我的版本),各位看自己的點。我把路徑寫這兒,大家直接複製吧,都是懶人。。(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA)。
具體的環境變量配置若失敗了可以去查查別的方法,我們的小火車要繼續往下走了。接下來是驗證階段:
去anaconda的prompt中找到如下路徑:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\extras\demo_suite,這裏面有兩個exe文件,運行後如果是pass說明CUDA終於安裝好了。
在這裏插入圖片描述

2、找相應的CUDNN(需要適配CUDA)

很好,已經完成第一步了,那麼再次回到NVIDIA的官網在右上角的搜索欄中搜“csdnn”,點擊這個(這玩意需要自己註冊,我當時是直接用qq登錄了)

在這裏插入圖片描述

點擊進去後尋找對應的版本,怎麼對應呢,看這個圖:(我的是CUDA8對應的cudnn應該是6,有木有發現根本沒有python3.7,真的坑,這個後面說)
在這裏插入圖片描述
安裝好cudnn後 ,解壓後發現是這樣的:
在這裏插入圖片描述

然後,把文件夾打開,把裏面的文件,文件,文件(重要的話說三遍!!)複製後拷貝到cuda相應的文件夾下。何爲相應的,就是你先打開我之前給的那個路徑:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA,裏面點進去v8.0後,你會看到這幾個文件夾,你把剛剛複製的文件放到這個文件夾。在這裏插入圖片描述
然後,到這裏爲止,cudnn安裝就算完成了。

3、安裝相應的TensorFlow-GPU
相應的TensorFlow-GPU對應的是CUDA,我的CUDA是8.0,那麼我應該安裝什麼樣的TensorFlow-GPU呢?
在這裏插入圖片描述
沒錯,我安了個1.5的後發現我是個呆頭,我最多隻能安裝1.4而已。

如果你的python很幸運不是3.7,那麼事情變得簡單起來,你只需要缺啥conda install啥就行了。比如你想安裝1.5版本的TensorFlow-GPU,那你只需在anaconda中輸入
conda uninstall tensorflow-gpu
#這個是卸載你當前版本的TensorFlow-gpu,如果你已經安裝了一個高版本的#那就先卸載了,沒有的話就直接下一句
conda install tensorflow-gpu==1.5.0
#這句是安裝指定版本的TensorFlow-gpu

安裝好以後可以寫一個測試的語句試一試,如果成功那就可以先休息一會兒了,測試語句如下:

在這裏插入圖片描述
4、Python版本過高需要降版本

不幸看到這裏的童鞋,我們都一樣~~~~慘
3.7居然太高了,這說明薑還是老的辣。如何降,我看到許多方法,我這裏只寫我的方法:

step1:
conda create -n py36 pythono=3.6 anaconda

step2:
安裝好後,可以選擇用
activate py36激活剛剛安的那個
用deactivate來退出3.6

當我第一次安裝好後激動的發現python --version變成3.6的時候,我已經準備要睡覺了,但是不幸發生了,當我再一次打開時候居然又變成了3.7!!!我的天吶。。。然後我還是去睡覺了(嗯,睡一覺就會好起來的)

早上起來我忽然發現了問題所在:看看這個!
我點開了window菜單發現了這裏居然有兩個prompt,其中一個是我昨天安好的3.6,另一個還是之前把我氣得吐血的3.7,我點開那個帶py36的,果然,這不就好起來了!
在這裏插入圖片描述

最後,祝願大家,今後的日子裏,安裝軟件一路順風!!!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章