文章目錄

安裝Nvidia GPU驅動

[推薦]Linux安裝NVIDIA顯卡驅動的正確姿勢
參考URL：https://blog.csdn.net/wf19930209/article/details/81877822

什麼是nouveau驅動？

nouveau，是一個自由及開放源代碼顯卡驅動程序，是爲Nvidia的顯示卡所編寫，也可用於屬於系統芯片的NVIDIA Tegra系列，此驅動程序是由一羣獨立的軟件工程師所編寫，Nvidia的員工也提供了少許幫助。

該項目的目標爲利用逆向工程Nvidia的專有Linux驅動程序來創造一個開放源代碼的驅動程序。

所以nouveau開源驅動基本上是不能正常使用的，驅動性能較差。

總結：因此，我們一般需要安裝官網原版驅動。

Centos7.7安裝Nvidia GPU驅動

Centos7.7安裝Nvidia GPU驅動及CUDA以及tensorflow-GPU
原文鏈接：https://blog.csdn.net/gy87900311/article/details/105074940

Ubuntu 18.04安裝Nvidia GPU驅動

參考URL: https://blog.csdn.net/wf19930209/article/details/81877822
Ubuntu18.04上安裝RTX 2080Ti顯卡驅動
原文鏈接：https://blog.csdn.net/wangzi11111111/article/details/90447326

準備工作

查看自己的機器的GPU

lspci | grep -i nvidia

查看當前電腦的顯卡型號
lshw -numeric -C display
驗證系統是否是受支持的Linux版本

uname -m && cat /etc/issue

到這裏可以查看受支持的Linux版本：https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#system-requirements
官網下載驅動
https://www.geforce.cn/drivers
到NVIDIA的官方驅動網站下載對應顯卡的驅動程序，下載後的文件格式爲run。
刪除原有的NVIDIA驅動程序

如果你沒有安裝過，或者已經卸載，可以忽略:

sudo apt-get remove --purge nvidia*

開始安裝

1、bios禁用禁用secure boot，也就是設置爲disable
如果沒有禁用secure boot,會導致NVIDIA驅動安裝失敗，或者不正常。

1、禁用nouveau
nouveau是一個第三方開源的Nvidia驅動，一般Linux系統安裝的時候都會默認安裝這個驅動。這個驅動會與nvidia官方的驅動衝突，在安裝nvidia驅動和cuda之前應該先禁用nouveau
查看系統是否正在使用nouveau

lsmod | grep nouveau

如果有任何輸出，那麼就是nouveau在啓用，需要關閉。，按照以下步驟：Ubuntu 中禁用方法：
vi /etc/modprobe.d/blacklist.conf
在最後一行添加：

blacklist nouveau
options nouveau modeset=0

這一條的含義是禁用nouveau第三方驅動，之後也不需要改回來。
由於nouveau是構建在內核中的，所以要執行下面命令生效:

sudo update-initramfs -u

機器重啓, 注意需要重啓

sudo reboot now

重啓之後，可以查看nouveau有沒有運行:

lsmod | grep nouveau  # 沒輸出代表禁用生效

停止可視化桌面
爲了安裝新的Nvidia驅動程序，我們需要停止當前的顯示服務器。最簡單的方法是使用telinit命令更改爲運行級別3。執行以下linux命令後，顯示服務器將停止，因此請確保在繼續之前保存所有當前工作（如果有）：

sudo telinit 3

2、安裝驅動
GPU服務器需要正常工作需要安裝正確的基礎設施軟件，對NVIDIA系列GPU而言，有兩個層次的軟件包需要安裝：
（1）驅動GPU工作的硬件驅動程序。
（2）上層應用程序所需要的庫

sudo chmod a+x NVIDIA-Linux-x86_64-440.82.run
sudo sh ./NVIDIA-Linux-x86_64-440.82.run --no-opengl-files

–no-opengl-files 參數必須加否則會循環登錄，也就是loop login
參數介紹：
–no-opengl-files 只安裝驅動文件，不安裝OpenGL文件。這個參數最重要
–no-x-check 安裝驅動時不檢查X服務
–no-nouveau-check 安裝驅動時不檢查nouveau
後面兩個參數可不加。

cat /var/log/nvidia-install.log

如果沒有問題，輸入nvidia-smi

nvidia-smi

安裝cuda

cuda是nvidia公司推出的一套編程環境，包括驅動，sdk，toolkit等。主要是用來進行計算加速，作爲協處理器來進行使用。同時cuda有很多的庫，如cublas，cufft等計算庫，在用於科學計算和人工智能領域都有很好的加速效果。

主要應用除了日常視頻編碼解碼，遊戲等外，可以應用於計算加速方面。拿我所接觸的行星模式模擬來講，GPU加速可以讓我們模擬的物理計算過程獲得很大的加速，加速科研產出。

一般使用，你可以跳過這一步！

官網下載cuda本地可執行run文件
https://developer.nvidia.com/cuda-toolkit-archive

注：根據ubuntu內核版本 gcc版本以及NVIDIA driver版本進行選擇，具體版本選擇參考官方文檔，附帶補丁包也需下載及安裝
安裝cuda

提升文件權限sudo chmod a+x cuda…run -> sudo ./cuda…run -> 按d翻頁 -> accept -> Install NVIDIA Driver? No否則會覆蓋之前安裝的Driver -> Install cuda toolkit? Yes -> toolkit localtion? default -> intall symbolic link? Yes -> Install samples? Yes -> samples location? default ->安裝完成

直接運行文件即可（bash ./***.run），主意之前安裝了驅動，所以在安裝的時候選擇不要安裝驅動即可，其餘的一路y下去。

注意：安裝CUDA時一定使用run文件，這樣可以進行選擇。不再選擇安裝驅動，以及在彈出xorg.conf時選擇NO

配置環境變量
vim ~/.bashrc

在末尾添加如下內容（依據NVIDIA官方文檔所述）

export CUDA_HOME=/usr/local/cuda-10.0

export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

之後source ~/.bashrc立即生效

reboot重啓，並驗證

cuda驗證
首先，測試 cuda, nvcc 命令是否可用

# cuda ; 按兩下 tab 鍵
cudafe                       cuda-gdb                     cuda-install-samples-9.0.sh
cudafe++                     cuda-gdbserver               cuda-memcheck
# nvcc --version

接下來，用 cuda 例程測試，找到例程的安裝目錄，默認在 /root 下
只需要挑選其中的幾個進行測試即可，比如

# cd 1_Utilities/deviceQuery
# make
# ./deviceQuery

至此，CUDA Toolkit 已經安裝完成。

檢測NVIDIA驅動是否成功安裝

使用nvidia-setting命令

apt install nvidia-settings
nvidia-setting

終端執行這個命令會調出圖形化NVIDIA的驅動管理程序。
如果出現這個界面可以看到 NVIDIA Driver Version：XXX.XX，這就代表nvidia-setting安裝正常。

使用nvidia-smi命令測試
英偉達系統管理接口（NVIDIA System Management Interface, 簡稱 nvidia-smi）是基於NVIDIA Management Library (NVML) 的命令行管理組件,旨在(intened to )幫助管理和監控NVIDIA GPU設備。

nvidia-smi

執行這條命令將會打印出當前系統安裝的NVIDIA驅動信息。

命令搜索集顯和獨顯

lspci | grep VGA     # 查看集成顯卡
lspci | grep NVIDIA  # 查看NVIDIA顯卡

如果都能搜索到說明正常。

集顯與獨顯的切換

使用nvidia-setting 圖形化切換
終端執行nvidia-setting,在彈的界面中選擇獨顯與集顯:
NVIDIA提供了一個切換顯卡的命令：

apt install nvidia-prime
sudo prime-select nvidia # 切換nvidia顯卡
sudo prime-select intel  # 切換intel顯卡
sudo prime-select query  # 查看當前使用的顯卡

注意：每一次切換顯卡都需要重新啓動電腦才能生效。

Linux 安裝Nvidia GPU顯卡驅動

文章目錄

安裝Nvidia GPU驅動

什麼是nouveau驅動？

Centos7.7安裝Nvidia GPU驅動

Ubuntu 18.04安裝Nvidia GPU驅動

準備工作

開始安裝

安裝cuda

檢測NVIDIA驅動是否成功安裝

集顯與獨顯的切換

2024年DataOps趨勢預測：AI不會取代數據工程師

雲原生週刊：K8s 中的服務和網絡｜ 2024.4.29

通過Http鏈接地址爬取有贊微信商城商品信息及下載至EXCEL

多人同時導出 Excel 幹崩服務器！新來的阿里大佬給出的解決方案太優雅了！

[轉帖]cpupower

今天，昨天，近七天，近30天，近90天，js封裝

華爲云云原生FinOps解決方案，釋放雲原生最大價值

filecoin-存儲證明子系統(rust-fil-proofs)[翻譯]

BLS算法-快速開始

安裝rust 編譯工具鏈

go-go環境安裝（windows、linux）

Linux 安裝Nvidia GPU顯卡驅動

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結