深度學習環境搭建安裝

參考鏈接https://blog.csdn.net/cpongo1/article/details/89541127

https://blog.csdn.net/sinat_23853639/article/details/80990967

目錄

1.    預先準備.... 1

2.    安裝依賴包.... 1

3.    禁用 nouveau.. 2

4.    配置環境變量.... 2

5.    安裝顯卡驅動.... 3

6.    安裝 CUDA 步驟.... 3

       之前沒有安裝過CUDA+cudnn:(以安裝cuda9.0爲例)... 3

       之前安裝過CUDA+cudnn:(以卸載cuda8.0,安裝cuda10.0爲例).... 7

 

 

1.預先準備

首先要明確你的系統版本,顯卡型號,每裝一個版本都需要驗證成功後再繼續,確保每一步的版本對應關係!!!!最好學習一些Linux的基本知識,零基礎的同學請謹慎操作。如果系統之前沒有安裝過CUDA請從頭開始,安裝過的請直接從5②開始,使用cpu的同學請不要按照這個參考文件安裝,直接安裝tensorflow,keras,pytorch就好。

2.安裝依賴包

安裝後續步驟或環境必需的依賴包,依次輸入以下命令:

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler

有一定機率安裝失敗而導致後續步驟出現問題,所以要確保以上依賴包都已安

成功,驗證方法就是重新運行安裝命令,如驗證 git cmake build-essential是否裝成功,則再次運行以下命令,成功的話會提示已安裝:

  1. 3.禁用 nouveau

安裝好依賴包後需要禁用 nouveau,只有在禁用掉 nouveau 後才能順利安裝NVIDIA 顯卡驅動,禁用方法就是在 /etc/modprobe.d/blacklist-nouveau.conf 文件中添加一條禁用命令,首先需要打開該文件,通過以下命令打開:

sudo vi /etc/modprobe.d/blacklist-nouveau.conf

打開後發現該文件中沒有任何內容,寫入:

保存時命令窗口可能會出現以下提示

** (gedit:4243): WARNING **: Set document metadata failed: 不支持設置屬性 metadata::gedit-position

無視此提示~,保存後關閉文件,注意此時還需執行以下命令使禁用 nouvea真正生效:

電腦重啓之後執行:

#沒有輸出,即說明安裝成功

 

4. 配置環境變量

同樣使用 vi命令打開配置文件

sudo vi ~/.bashrc

打開後在文件最後加入以下兩行內容:

保存退出:

輸入命令:source ~/.bashrc

5. 安裝顯卡驅動

手動去官網下載.run文件自己安裝(要搞清楚顯卡型號後再去找對應的文件下載)卸載原先的所有驅動:

安裝驅動

進入命令行界面:Ctrl-Alt+F1  之後輸入用戶名和密碼登錄即可。Ctrl-Alt+F7 退出命令行界面。

輸入:

sudo service lightdm stop

輸入:

sudo chmod a+x NVIDIA-Linux-x86_64-390.59.run

sudo ./NVIDIA-Linux-x86_64-390.59.run –no-opengl-files

 

安裝顯卡驅動時,就一路Accept就可以,報錯The distribution-provided pre-install script failed!,不必理會,繼續安裝。最重要的一步,安裝程序問你是否使用NVIDIA的xconfig文件,如果是獨顯,這裏一點要選yes,否則在啓動x-window時不會使用nvidia驅動。安裝提示基本是選肯定的,提示nvidia-xconfig時如果你的電腦還存在一個核顯或者集顯就選擇不安裝,選擇no,反之選擇安裝yes。安裝完畢後,重啓:reboot (重啓)。

 

 
 


如果已經存在,執行:nvidia-smi,有類似如下輸出代表nvidia驅動正常

 

6.安裝 CUDA 步驟

 

 
 


進入https://developer.nvidia.com/cuda-toolkit-archive找到對應的文件並下載

 

 

 
 

 

 

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

上面下載的1.6G的 CUDA中包含有 nvidia 顯卡驅動,故此步驟 CUDA 的安裝包括了 nvidia 顯卡驅動的安裝,若可以保證已安裝正確的 nvidia 顯卡驅動,則直接開始安裝 CUDA 9.0,在安裝過程中選擇不再安裝 nvidia 顯卡驅動。爲了方便開始安裝過程的路徑查找,把下載的 CUDA 安裝文件移動到 HOME 路徑下,然後通過 Ctrl + Alt + F1 進入文本模式,輸入帳號密碼登錄,通過 Ctrl + Alt + F7 可返回圖形化模式,在文本模式登錄後首先關閉桌面服務:

sudo service lightdm stop

 

然後通過 Ctrl + Alt + F7 發現已無法成功返回圖形化模式,說明桌面服務已成功關閉,注意此步對接下來的 nvidia 驅動安裝尤爲重要,必需確保桌面服務已關閉。

cd到.run 文件所處的路徑下,安裝cuda

其中 cuda_9.0.176_384.81_linux.run 是我的 CUDA 安裝文件名,而你需替換爲自己的 CUDA 安裝文件名,若此時忘記可直接通過 ls 文件查看文件名,這也是我建議把 CUDA 安裝文件移動到 HOME 下的另一個原因。按q結束cuda的描述等,然後輸入accept,然後是提示是否安裝NVIDIA驅動,因爲之前已經安裝過,就輸入n,下一個提示是是否安裝CUDA Toolkit,輸入y,後面的提示都是使用默認或者y了,安裝完會顯示哪些安裝成功,哪些安裝失敗,一般都會沒有問題的,按照步驟安裝,第一個就是問你是否安裝顯卡驅動,由於前一步已經安裝了顯卡驅動,所以這裏就不需要了,況且 runfile 自帶的驅動版本不是最新的。

剩下的選擇則都輸入“y”確認安裝或確認默認路徑安裝,開始安裝,此時若出現安裝失敗提示則可能爲未關閉桌面服務或在已安裝 nvidia 驅動的情況下重複再次安裝 nvidia 驅動,安裝完成後輸入重啓命令重啓:reboot

重啓後登錄進入系統,配置 CUDA 環境變量,使用 vi 命令打開配置文件:

sudo vi ~/.bashrc

 

 
 


在該文件最後加入以下兩行並保存:

 


使該配置生效:

驗證 CUDA 9.0 是否安裝成功

分別執行以下三條命令:


若看到類似以上信息則說明 cuda 已安裝成功:

安裝對應的cudnn:

登錄官網:https://developer.nvidia.com/rdp/cudnn-download ,下載對應 cuda 版本且 linux 系統的 cudnn 壓縮包,注意官網下載 cudnn 需要註冊帳號並登錄。


下載以下4個文件:

然後解壓tgz包, 複製文件到cuda環境, 接着安裝deb包.(以下名字要換成你下載文件的對應四個名字

安裝完成後可用 nvcc -V 命令驗證是否安裝成功,若出現以下信息則表示安裝成功:

由於不同版本的tensorflow對於CUDNN的版本要求不同,所以有時需要對CUDNN進行更換。具體版本的對應關係如下:

https://blog.csdn.net/oMoDao1/article/details/83241074

卸載CUDA:(使用cuda的卸載工具,不同版本的名字不同,請先查看你的cuda版本

卸載之後,會發現 /usr/local/cuda-8.0目錄下任然有文件存在,這是cudnn文件,所以還需要將cuda-8.0文件刪除乾淨:

 

進入https://developer.nvidia.com/cuda-toolkit-archive找到對應的文件並下載

md5檢測一下, 不合格要重新下載:

關閉圖形界面:

輸入:

同樣不要選擇安裝顯卡驅動!!!!!!!!!

安裝後,添加環境變量:

寫入:

激活:

驗證是否安裝成功:

出現以下類似信息則安裝成功:

安裝對應的cudnn:

然後解壓tgz包, 複製文件到cuda環境, 接着安裝deb包.

驗證是否安裝成功:

出現以下信息則表明安裝成功:

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章