Ubuntu pytorch安装(GPU)及NVIDIA显卡驱动安装知识总结

首先是重要参考文章
https://www.jb51.net/article/146555.htm
回头慢慢写
https://www.cnblogs.com/ranxf/p/9412242.html
https://www.jianshu.com/p/ea169536850f

先明确几个概念,我是为了装GPU加速的pytorch跑神经网络的,结果以为就是装个显卡驱动,事实证明做事前花一分钟想想是必要的。
下面第一步是不需要的(直接安装NVIDIA显卡驱动),当然失败也是收获,讲一下如何安装驱动(我装完卸载了)(重要参考文章https://www.jb51.net/article/146555.htm):

  1. 禁用Nouveau显卡驱动
    在进入grub启动界面时,10秒内使用↑↓键选中Ubuntu,按e键进行编辑,在倒数第二行quiet slash后添加acpi_osi=linux nomodeset
quiet slash acpi_osi=linux nomodeset

该方法只是暂时禁用Nouveau显卡驱动,在进入桌面后需要在grub的配置文件里面更改已使得其永久有效,在命令行中输入如下命令:

$ sudo gedit /boot/grub/grub.cfg

2.使用标准Ubuntu仓库进行自动化安装

(1)检测你的NVIDIA显卡型号和推荐的驱动程序的模型。在命令行中输入如下命令:

$ ubuntu-drivers devices

找到recommend这一项对应的版本号
我的建议安装的是nvidia-440版本驱动,然后继续在命令行输入:

$ sudo ubuntu-drivers autoinstall

将会自动安装所推荐的nvidia-440版本驱动

安装过程中,可能会提示需要secure boot,按照默认一步步来即可(我在哪个博客中看到需要先在BIOS中禁用secure boot,我就禁用了,所以我在这里什么都没操作)

至此,Nvidia驱动安装完成,重启后即可生效(备注:需要重启!然后输入nvidia-smi即可查看对应信息)另外:Linux里面,输入命令以后没有异常输出,error或者warning,或者没有输出就是最好的输出,只是提醒一下)

然后在下一篇博客里面我看到安装cuda-tookit(给pytorch GPU加速用的主要结构)需要卸载掉驱动,于是我又sudo apt-get remove --purge nvidia-*后来发现其实可以不用卸载(在安装cuda的时候在安装驱动时选择no,当然如果卸载掉的话,安装cuda时一路回车就好(cuda里面包含了显卡驱动)),重要参考文章:(https://blog.csdn.net/m0_37518259/article/details/80983024):
官网下载CUDA驱动,官网链接:here。请注意,要下载.deb文件。当选择好文件后,官网会给出相应的Installation instructions,照着来没错。(我也是按照这样做的,下面有五六句命令即可安装完毕,但是下面的验证我没有通过不知道为什么,提示我需要安装,我也懒得管了,因为后面发现别人博客自己编译,不选择deb,而是选择了runfile(local)的貌似都通过了,但是影响不大,我最后验证了pytorch GPU可以使用。大家有知道的可以评论解释一下,感谢。

Command 'nvcc' not found, but can be installed with:

sudo apt install nvidia-cuda-toolkit

接下来验证安装结果,报错说明没安装成功。

nvcc -V

接下来参考博客就直接区庄pytorch了,如下:
到PyTorch官网(here)下载pytorch安装包或直接使用命令安装,请注意科学上网:),然后检查显卡是否可用:

python
    >>> import pytorch
    >>> print(torch.cuda.is_available())

返回true说明安装成功。
但是我又去安装了cudnn,(手动狗头,我现在也不知道为什么要装这个)重要参考文章:https://www.jianshu.com/p/ea169536850f
https://blog.csdn.net/u010801439/article/details/80483036我是看的第二个做的:cuDNN安装步骤

接下来我们安装cuDNN
在下载cuDNN之前,我们需要注册一个账号

cuDNN is freely available to members of the Accelerated Computing Developer Program

注册完账号后我们选择下载
选择cuDNN v5.1 Library for Linux

安装cuDNN非常简单,我们只需解压下载的包,并将其拷贝到lib64和include这两个目录即可

$ cd ~
$ tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
$ cd cuda
$ sudo cp lib64/* /usr/local/cuda/lib64/
$ sudo cp include/* /usr/local/cuda/include/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*

恭喜你! cuDNN 已经安装成功,解释一下,解压完就是cuda这个文件夹,进行一下复制和授权
接下来就可以安装相应的软件,如:anaconda,pycharm tensorflow 等。。。当然之前安装也是没有毛病的。

最后的pytorch安装,重要参考博客https://blog.csdn.net/red_stone1/article/details/78727096
当然其实就是打开PyTorch官网:
PyTorch

应该会自动读取你机器版本以及cuda的版本等等,直接运行它给的conda命令即可(需要提前安装好anaconda)

conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

进去一看就知道了,没有截图工具就不截图了。

查看显卡信息相关命令:
https://www.cnblogs.com/ranxf/p/9412242.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章