Linux 安裝Nvidia GPU顯卡驅動

安裝Nvidia GPU驅動

[推薦]Linux安裝NVIDIA顯卡驅動的正確姿勢
參考URL:https://blog.csdn.net/wf19930209/article/details/81877822

什麼是nouveau驅動?

nouveau,是一個自由及開放源代碼顯卡驅動程序,是爲Nvidia的顯示卡所編寫,也可用於屬於系統芯片的NVIDIA Tegra系列,此驅動程序是由一羣獨立的軟件工程師所編寫,Nvidia的員工也提供了少許幫助。

該項目的目標爲利用逆向工程Nvidia的專有Linux驅動程序來創造一個開放源代碼的驅動程序。

所以nouveau開源驅動基本上是不能正常使用的,驅動性能較差。

總結:因此,我們一般需要安裝官網原版驅動。

Centos7.7安裝Nvidia GPU驅動

Centos7.7安裝Nvidia GPU驅動及CUDA以及tensorflow-GPU
原文鏈接:https://blog.csdn.net/gy87900311/article/details/105074940

Ubuntu 18.04安裝Nvidia GPU驅動

參考URL: https://blog.csdn.net/wf19930209/article/details/81877822
Ubuntu18.04上安裝RTX 2080Ti顯卡驅動
原文鏈接:https://blog.csdn.net/wangzi11111111/article/details/90447326

準備工作

  1. 查看自己的機器的GPU

    lspci | grep -i nvidia

    查看當前電腦的顯卡型號
    lshw -numeric -C display

  2. 驗證系統是否是受支持的Linux版本

    uname -m && cat /etc/issue

    到這裏可以查看受支持的Linux版本:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#system-requirements

  3. 官網 下載驅動
    https://www.geforce.cn/drivers
    到NVIDIA的官方驅動網站下載對應顯卡的驅動程序,下載後的文件格式爲run。

  4. 刪除原有的NVIDIA驅動程序

    如果你沒有安裝過,或者已經卸載,可以忽略:

    sudo apt-get remove --purge nvidia*

開始安裝

1、bios禁用禁用secure boot,也就是設置爲disable
如果沒有禁用secure boot,會導致NVIDIA驅動安裝失敗,或者不正常。

1、禁用nouveau
nouveau是一個第三方開源的Nvidia驅動,一般Linux系統安裝的時候都會默認安裝這個驅動。這個驅動會與nvidia官方的驅動衝突,在安裝nvidia驅動和cuda之前應該先禁用nouveau
查看系統是否正在使用nouveau

lsmod | grep nouveau

如果有任何輸出,那麼就是nouveau在啓用,需要關閉。,按照以下步驟:Ubuntu 中禁用方法:
vi /etc/modprobe.d/blacklist.conf
在最後一行添加:

blacklist nouveau
options nouveau modeset=0

這一條的含義是禁用nouveau第三方驅動,之後也不需要改回來。
由於nouveau是構建在內核中的,所以要執行下面命令生效:

sudo update-initramfs -u

機器重啓, 注意 需要重啓

sudo reboot now

重啓之後,可以查看nouveau有沒有運行:

lsmod | grep nouveau  # 沒輸出代表禁用生效

停止可視化桌面
爲了安裝新的Nvidia驅動程序,我們需要停止當前的顯示服務器。最簡單的方法是使用telinit命令更改爲運行級別3。執行以下linux命令後,顯示服務器將停止,因此請確保在繼續之前保存所有當前工作(如果有):

sudo telinit 3

2、安裝驅動
GPU服務器需要正常工作需要安裝正確的基礎設施軟件,對NVIDIA系列GPU而言,有兩個層次的軟件包需要安裝:
(1)驅動GPU工作的硬件驅動程序。
(2)上層應用程序所需要的庫

sudo chmod a+x NVIDIA-Linux-x86_64-440.82.run
sudo sh ./NVIDIA-Linux-x86_64-440.82.run --no-opengl-files

–no-opengl-files 參數必須加否則會循環登錄,也就是loop login
參數介紹:
–no-opengl-files 只安裝驅動文件,不安裝OpenGL文件。這個參數最重要
–no-x-check 安裝驅動時不檢查X服務
–no-nouveau-check 安裝驅動時不檢查nouveau
後面兩個參數可不加。

cat /var/log/nvidia-install.log

如果沒有問題,輸入nvidia-smi

nvidia-smi

安裝cuda

cuda是nvidia公司推出的一套編程環境,包括驅動,sdk,toolkit等。主要是用來進行計算加速,作爲協處理器來進行使用。同時cuda有很多的庫,如cublas,cufft等計算庫,在用於科學計算和人工智能領域都有很好的加速效果。

主要應用除了日常視頻編碼解碼,遊戲等外,可以應用於計算加速方面。拿我所接觸的行星模式模擬來講,GPU加速可以讓我們模擬的物理計算過程獲得很大的加速,加速科研產出。

一般使用,你可以跳過這一步!
  1. 官網下載cuda本地可執行run文件
    https://developer.nvidia.com/cuda-toolkit-archive

    注:根據ubuntu內核版本 gcc版本以及NVIDIA driver版本進行選擇,具體版本選擇參考官方文檔,附帶補丁包也需下載及安裝

  2. 安裝cuda

    提升文件權限sudo chmod a+x cuda…run -> sudo ./cuda…run -> 按d翻頁 -> accept -> Install NVIDIA Driver? No否則會覆蓋之前安裝的Driver -> Install cuda toolkit? Yes -> toolkit localtion? default -> intall symbolic link? Yes -> Install samples? Yes -> samples location? default ->安裝完成

    直接運行文件即可(bash ./***.run),主意之前安裝了驅動,所以在安裝的時候選擇不要安裝驅動即可,其餘的一路y下去。

    注意: 安裝CUDA時一定使用run文件,這樣可以進行選擇。不再選擇安裝驅動,以及在彈出xorg.conf時選擇NO

  3. 配置環境變量
    vim ~/.bashrc

    在末尾添加如下內容(依據NVIDIA官方文檔所述)
    
    export CUDA_HOME=/usr/local/cuda-10.0
    
    export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
    
    export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    
    之後source ~/.bashrc立即生效
    

    reboot重啓,並驗證

  4. cuda驗證
    首先,測試 cuda, nvcc 命令是否可用

    # cuda ; 按兩下 tab 鍵
    cudafe                       cuda-gdb                     cuda-install-samples-9.0.sh
    cudafe++                     cuda-gdbserver               cuda-memcheck
    # nvcc --version
    

    接下來,用 cuda 例程測試,找到例程的安裝目錄,默認在 /root 下
    只需要挑選其中的幾個進行測試即可,比如

    # cd 1_Utilities/deviceQuery
    # make
    # ./deviceQuery
    

    至此,CUDA Toolkit 已經安裝完成。

檢測NVIDIA驅動是否成功安裝

  1. 使用nvidia-setting命令
apt install nvidia-settings
nvidia-setting

終端執行這個命令會調出圖形化NVIDIA的驅動管理程序。
如果出現這個界面可以看到 NVIDIA Driver Version:XXX.XX,這就代表nvidia-setting安裝正常。

  1. 使用nvidia-smi命令測試
    英偉達系統管理接口(NVIDIA System Management Interface, 簡稱 nvidia-smi)是基於NVIDIA Management Library (NVML) 的命令行管理組件,旨在(intened to )幫助管理和監控NVIDIA GPU設備。
nvidia-smi

執行這條命令將會打印出當前系統安裝的NVIDIA驅動信息。

  1. 命令搜索 集顯和獨顯
lspci | grep VGA     # 查看集成顯卡
lspci | grep NVIDIA  # 查看NVIDIA顯卡

如果都能搜索到說明正常。

集顯與獨顯的切換

  1. 使用nvidia-setting 圖形化切換
    終端執行nvidia-setting,在彈的界面中選擇獨顯與集顯:
    在這裏插入圖片描述
  2. NVIDIA提供了一個切換顯卡的命令:
apt install nvidia-prime
sudo prime-select nvidia # 切換nvidia顯卡
sudo prime-select intel  # 切換intel顯卡
sudo prime-select query  # 查看當前使用的顯卡

注意: 每一次切換顯卡都需要重新啓動電腦才能生效。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章