ubuntu從零開始搭建cuda環境(一)

一、Ubuntu安裝

ubuntu安裝過程就不贅述了,網上有許多教程可以參考,這邊貼幾個給大家

windows下安裝ubuntu雙系統:

https://blog.csdn.net/flyyufenfei/article/details/79187656

ubuntu安裝:

https://club.lenovo.com.cn/thread-5432878-1-1.html

 

Ubuntu安裝好後開始搭建GPU環境

 

二、環境搭建

 

首先安裝顯卡驅動

查看顯卡的硬件型號

執行

lshw -numeric -C display

或者

lspci -vnn | grep VGA

卸載先前所有的驅動(可以選擇不卸載)

執行

sudo apt-get remove --purge nvidia*

禁用nouveau驅動

方法一、

sudo gedit /etc/modprobe.d/blacklist.conf

文件最後添加:

blacklist nouveau

blacklist lbm-nouveau

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

保存關閉文件

執行

echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

使更改生效

sudo update-initramfs -u

重啓

sduo reboot

方法二、

使用root權限執行

sudo vi /etc/modprobe.d/blacklist-nouveau.conf

#添加下列兩行

blacklist nouveau

options nouveau modeset=0

#重新生成 kernel initramfs,使更改生效

update-initramfs –u

#重啓

sudo reboot

方法三、

依次執行:

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

執行完上面兩條指令後,使用如下命令看看是否成功禁用了開源驅動:cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf。如果和下面一樣,表示成功了。

$ cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf
blacklist nouveau
options nouveau modeset=0

然後再重啓電腦即可

 

重啓後驗證驅動是否被禁用 如果無結果顯示則表明成功禁用

lsmod | grep nouveau

Nidia驅動三種安裝方法

使用標準Ubuntu倉庫進行自動化安裝

ubuntu-drivers devices

查看顯卡類型和推薦的驅動版本,這邊推薦的是nvidia-driver-435,可以按其推薦那裝也可以自行選擇版本安裝。

sudo ubuntu-drivers autoinstall

上述命令可自動安裝推薦版本,也可以使用 apt 命令安裝自己想要安裝的版本,例如想安裝 340 這個版本號的版本,終端輸入:

sudo apt install nvidia-340 

安裝過程中按照提示操作,除非你知道每個提示的真實含義,否則所有的提示都選擇默認就可以了,安裝完成後重啓系統,NVIDIA 顯卡就可以正常工作了。安裝完成後你可以參照

 https://linuxconfig.org/benchmark-your-graphics-card-on-linux 上的介紹測試你的顯卡

使用PPA倉庫進行自動化安裝

使用圖形驅動程序PPA存儲庫允許我們安裝NVIDIA beta驅動程序,但是這種方法存在不穩定的風險

sudo add-apt-repository ppa:graphics-drivers/ppa      //添加ppa庫到系統中
sudo apt update         //  更新
 
sudo ubuntu-drivers devices // 顯示可以安裝的nvidia驅動

sudo apt install nvidia-xxx        //  你想安裝的nVidia驅動的版本

使用官方的NVIDIA驅動進行手動安裝

查看完電腦顯卡硬件信息後,可以到 NVIDIA 的官網下載相應型號的驅動,地址是:

https://www.nvidia.com/Download/index.aspx

選擇你對應的顯卡型號和系統進行SEARCH下載

 

官方最新版本號已經是 440.44了。點擊下載。

或者https://developer.nvidia.com/cuda-toolkit-archive下載需要的cuda版本

接着需要先安裝一些 NVIDIA 顯卡依賴的軟件,在終端依次執行如下命令:

sudo dpkg --add-architecture i386
sudo apt update
sudo apt install build-essential libc6:i386

停止可視化桌面

sudo telinit 3

之後會進入一個新的命令行會話,然後按快捷鍵:CTRL+ALT+F1 進入tty命令行界面,

或者

sudo service lightdm stop #這會關閉圖形界面,但不用緊張

Ctrl-Alt+F1進入命令行界面,

小提示:在命令行輸入:sudo service lightdm start ,然後按Ctrl-Alt+F7即可恢復到圖形界面

 

問題:

可能會遇到

Failed to stop lightdm.service: Unit lightdm.service not loaded.

而且

Failed to start lightdm.service: Unit lightdm.service not loaded.

這可能是爲安裝lightdm的原因,可以嘗試下安裝lightdm後再進行操作

sudo apt-get install lightdm

 

進入tty界面後輸入用戶名和密碼,進行登錄,進入保存下載 NVIDIA 驅動的目錄。

在相應路徑下安裝NVIDIA驅動(安裝文件也可爲.sh後綴,如果提示沒有權限使用sudo):

.bin文件

bash NVIDIA-Linux-x86_64-384.111.bin

按照以下步驟:

  Accept License
  The distribution-provided pre-install script failed! Are you sure you want to continue? -> CONTINUE INSTALLATION
  Would you like to run the nvidia-xconfig utility? -> YES

 

.run文件

#給驅動run文件賦予執行權限:
sudo chmod +x NVIDIA-Linux-x86_64-384.59.run
#後面的參數非常重要,不可省略:
sudo ./NVIDIA-Linux-x86_64-384.59.run –no-opengl-files
  • –no-opengl-files:表示只安裝驅動文件,不安裝OpenGL文件。這個參數不可省略,否則會導致登陸界面死循環,英語一般稱爲”login loop”或者”stuck in login”。
  • –no-x-check:表示安裝驅動時不檢查X服務,非必需。
  • –no-nouveau-check:表示安裝驅動時不檢查nouveau,非必需。
  • -Z, --disable-nouveau:禁用nouveau。此參數非必需,因爲之前已經手動禁用了nouveau。
  • -A:查看更多高級選項。

必選參數解釋:因爲NVIDIA的驅動默認會安裝OpenGL,而Ubuntu的內核本身也有OpenGL、且與GUI顯示息息相關,一旦NVIDIA的驅動覆寫了OpenGL,在GUI需要動態鏈接OpenGL庫的時候就引起問題。

之後,按照提示安裝,成功後重啓即可。 
如果提示安裝失敗,不要急着重啓電腦,重複以上步驟,多安裝幾次即可。

 

在安裝結束後,在命令行輸入一下命令重啓,NVIDIA驅動即可安裝成功:

sudo reboot

Driver測試:

nvidia-smi #若列出GPU的信息列表,表示驅動安裝成功
nvidia-settings #若彈出設置對話框,亦表示驅動安裝成功

下一篇介紹cuda和cudnn的安裝配置。

發佈了11 篇原創文章 · 獲贊 6 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章