【GPU linux環境搭建】10分鐘瞭解下centos 下 GPU搭建過程

無意中發現了一個巨牛的人工智能教程,忍不住分享一下給大家。教程不僅是零基礎,通俗易懂,而且非常風趣幽默,像看小說一樣!覺得太牛了,所以分享給大家。點這裏可以跳轉到教程。人工智能教程

主要內容

1、深度學習顯卡驅動安裝
2、cudatoolkit安裝
3、cudnn安裝
4、驗證安裝成功

一、基本環境信息
顯卡:GeForce GTX 1660
操作系統:CentOS 7.4

二、基礎環境驗證
驗證系統是否能正常識別 GPU

lspci | grep -i nvidia

在這裏插入圖片描述
這裏看到有2塊顯卡。

三、檢查系統需要的驅動版本安裝

yum erase kmod-nvidia
yum install nvidia-detect
nvidia-detect -v

顯示我們需要的驅動版本是440.36,因此我們 去官網下載對應的版本驅動即可。

[10de:2184] NVIDIA Corporation TU116 [GeForce GTX 1660]
This device requires the current 440.36 NVIDIA driver kmod-nvidia
[10de:2184] NVIDIA Corporation TU116 [GeForce GTX 1660]
This device requires the current 440.36 NVIDIA driver kmod-nvidia
[15ad:0405] VMware SVGA II Adapter
WARNING: Xorg log file /var/log/Xorg.0.log does not exist
WARNING: Unable to determine Xorg ABI compatibility
WARNING: The driver for this device does not support the current Xorg version

四、下載需要的驅動、cuda、cudnn

先把需要安裝的東西下載下載。
注意:tensorflow2.0 只支持 cuda 版本 10.0,cuda版本不要下載cuda10.2最新版本。

驅動版本  440.36
cuda版本 10.0
cudnn版本 7.6.4

驅動下載地址:https://www.geforce.cn/drivers
手動搜索驅動程序,選擇相應型號的版本。
在這裏插入圖片描述

在這裏插入圖片描述

cuda下載地址:https://developer.nvidia.com/cuda-toolkit-archive

在這裏插入圖片描述

cudnn 下載:https://developer.nvidia.com/rdp/cudnn-archive
在這裏插入圖片描述
註冊個賬號去下載,即可。

五、安裝依賴
要裝的三個依賴分別是,gcc、kernel-devel、dkms,其中需要注意的是,kernel-devel的版本需要與當前內核的版本一致,不然後面會出現找不到文件的情況。

更新所有軟件包:
yum -y update

安裝依賴:
yum -y install kernel-devel epel-release dkms gcc gcc-g++

查看我的內核版本:
uname -r

查看一下可以安裝的kernel-devel版本: 
yum list | grep kernel-devel

檢查系統是否已安裝kernel-devel版本
rpm -q kernel-devel-3.10.0-1062.12.1.el7.x86_64

如果沒有安裝,到https://centos.pkgs.org/7/centos-updates-x86_64/下載對應的kernel 版本

安裝方法:
rpm -ivh kernel-devel-3.10.0-1062.12.1.el7.x86_64.rpm

yum -y install gcc dkms

如果已經安裝對應上了,就重啓電腦
reboot 

6、禁用 nouveau

查看是否禁用成功,有顯示東西,則說明沒有禁用成功。
lsmod | grep nouveau

echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

再次查看是否禁用成功,沒有顯示什麼東西,就禁用成功
lsmod | grep nouveau

7、安裝驅動

./NVIDIA-Linux-x86_64-440.36.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.12.1.el7.x86_64 --no-opengl-files


驗證驅動是否已安裝成功

nvidai-smi

8、安裝cuda

sudo sh cuda_10.0.130_410.48_linux.run

或者 conda install cudatoolkit=10.0

9、安裝cudnn

sudo sh cudnn文件
或者
conda install cudnn=7.6.4
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章