华为matebook win+deepin 15.11双系统 + 双显卡 + 使用/卸载大黄蜂方案 + NVIDIA独显驱动安装 + tensorflow-gpu-2.0

先说结果,我没安装成功NVIDIA的最新驱动,因为我的BIOS上没有切换显卡的设置。
但是我觉得有几个需要说的提醒在这里总结一下!
1、如果你之前在windows上没有装过NVIDIA驱动或CUDA,可以通过这个网站看你的 显卡是否支持CUDA

2、如果你的深度显卡驱动管理器中没有NV-Prime方案(如 deepin 15.11这个最新版本就删掉了这个方案),那你可以继续往下看。

3、先看看你的BIOS上支不支持切换显卡驱动,不支持的话,安装独显驱动很可能是无功而返!

4、如果你已经成功的使用上了大黄蜂方案,而且你要求的一些环境不高的话(比如你不用tensorflow2.0,tf2.0要求CUDA10.0,即驱动版本>=410.48),装个CUDA8、CUDA9还是可以的。deepin的驱动更新慢已经是常态了,不知道后续深度会不会更新(更新了的话,评论区提醒我一声儿呗)。下表是NVIDIA驱动和CUDA兼容表。

在这里插入图片描述

一、大黄蜂方案下的cuda + cudnn + tensorflow-gpu版本安装

通过nvidia-smi,我们可以查看显卡信息,以确认我们的驱动是否正确安装了,在终端内输入:

optirun nvidia-smi

显卡信息可以看到你的驱动版本,从而选择适合的CUDA和CuDNN版本。
若是显卡驱动安装正确,运行上面的命令,你会看到相似于下面的输出,驱动版本是390.87:
在这里插入图片描述

大黄蜂方案的显卡驱动是由bumblebee进行管理的。为了下降能耗,平时独显是处于关闭状态的,若是有程序须要使用到独显,需要经过optirun进行启动。
关于bumblebee版显卡驱动在深度学习训练中的开启和关闭:
在进行训练前,在终端输入sudo tee /proc/acpi/bbswitch <<< ON,可开启显卡。
在训练结束后,在终端输入sudo tee /proc/acpi/bbswitch <<< OFF,可关闭显卡。

具体参考:
《deepin-15.5 + 小米笔记本pro 下的深度学习环境cuda8 +tensorflow-gpu-1.4版本搭建过程》


二、如果你的BIOS支持切换显卡驱动,请将N卡设为初始显卡

那你算是比较幸运的了,虽然没有NV-Prime方案,但是给了打开了一扇窗。

1、如果你之前使用过大黄蜂方案,需要删除大黄蜂所安装的软件,可以用以下命令:

dpkg -l | grep -i nvidia | awk '{ print $2 }' | cut -d: -f1 | xargs apt-get -y remove --purge

如果报错——无法打开锁文件 /var/lib/dpkg/lock - open (13: 权限不够),可以sudo -s 输入一次密码 进入root模式,再重试。

2、如果你在看到这篇之前,已经下载了不合意的驱动,或是上面删除大黄蜂所安装软件后,
还需要输入dpkg -l | grep -i nvidia命令来查看是否还有残余驱动,如果还有显示,则输入下面命令进行卸载:

sudo apt-get --purge remove nvidia*

3、安装编译所需的软件

sudo apt -y install linux-headers-amd64 linux-headers-deepin-amd64 gcc make dkms

剩下的步骤参考:使用其【快捷方法】即可。
深度科技论坛——如何手动安装NVIDIA驱动软件


三、下载CUDA和CuDNN

去官网下载适合你的CUDA,注意要和你的驱动适配,如果要安装tensorflow2.0建议CUDA10.0或10.1。
《下载适合你的CUDA》
《下载适配的CuDNN》

下载好后,
如果有图形化界面则需要禁用x-window服务
右键属性=>允许作为可执行程序执行,双击终端运行即可。
或者输入下面的命令(文件名自行调整)

sudo sh cuda_8.0.61_375.26_linux.run

这个时候会有很多提示需要你确认,由于在第一步已经成功安装了显卡驱动,所以这里就不需要再次安装了,因此 ,Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 3XX.XX ?这里选择 no,其余都是yes或者accept

最后在.bashrc添加环境变量后source .bashrc

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

参考:《linux安装GPU显卡驱动、CUDA和cuDNN库》


四、遇到的一些问题

不知道是笔记本的原因还是因为deepin系统没装好,在我Ctrl+Alt+f1进入tty1文本控制台时,会有持续不断的报错,反复report,下面的这个report会一直往下输出循环。如果你也遇到了这个,不要慌,像平常一样硬着头皮输入你的命令,就算是被report分隔都还是可以运行的(如果输入错了,可以Ctrl+C重新输入)

deepin linux  not implement report

五、安装tf2.0并测试

你可以在终端中输入pip install tensorflow-gpu==2.0.0b1即可,如果觉得下载慢可以更换到国内的阿里云镜像源。
完成后,
在终端中打开并输入python。

>>> import tensorflow as tf
>>> tf.test.is_gpu_available()

如果结果是True,恭喜你安装成功!


参考:
《deepin-15.5 + 小米笔记本pro 下的深度学习环境cuda8 +tensorflow-gpu-1.4版本搭建过程》
《Ubuntu 卸载nvidia驱动、CUDA Toolkit》
深度科技论坛——如何手动安装NVIDIA驱动软件

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章