开发环境:
GPU: NVIDIA TITAN XP
OS:Xubuntu 18.04
新装系统,没有NVIDIA显卡驱动。先卸载已有驱动
sudo apt-get remove --purge nvidia*
安装库
sudo apt-get update
sudo apt-get install dkms build-essential linux-headers-generic
禁用nouveau
sudo vim /etc/modprobe.d/blacklist.conf
输入:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
接着终端输入:
echo options nouveau modeset=0
sudo update-initramfs -u
重启. 如果运行如下指令没用打印出任何内容, 恭喜你, 禁用nouveau成功了.
lsmod | grep nouveau
补一些库
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
我没有自行安装驱动。直接下了cuda10一起安了。CUDA10 下载页面:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal
按照页面所述代码,下载并安装CUDA10:
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run
因为没有驱动,我就一并安装了。
安装成功后,设置环境变量。
运行命令
sudo gedit ~/.bashrc
将以下命令写入文件最后
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
注:关于这个环境变量,我也比较疑惑。写成下面内容也可以:
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存退出,输入命令:source ~/.bashrc ,重启生效。(我没重启也可以)
验证是否生效,执行
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
报错:无法make,提示找不到nvscibuf.h。打开/usr/local/cuda/samples/1_Utilities/deviceQuery文件下的Makefile(gedit就行),第41行改为:
FILTER_OUT := 0_Simple/cudaNvSci/Makefile
出现Result = PASS则表示安装成功通过
然后安装cudnn
CUDA 10.2对应cudnn版本7.5.6 下载页面如下:
https://developer.nvidia.com/rdp/cudnn-download
记得注册登录。威信就能注册。很方便
官网安装教程
- Navigate to your <cudnnpath> directory containing the cuDNN Tar file. 进入到cudnn下载目录
- Unzip the cuDNN package.解压cudnn压缩包
$ tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
- Copy the following files into the CUDA Toolkit directory, and change the file permissions.将下列文件拷贝到CUDA Toolkit目录,更改文件权限
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 $ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
我看有的博客上还加了一句
sudo chmod a+r /usr/local/cuda/include/cudnn.h
命令行下输入mysql --help如果是输出一串帮助提示的话,那么cudnn就安装好了
这个时候该安装anaconda了。终端输入python,发现默认python是2.7。查看系统python版本
ls /usr/bin/python*
查看Python的指向
ls -l /usr/bin/ | grep python
可以看到python -> python2.7
,所以要把它指向下面那个Python3.6
删除原来的软链接,建立新的链接
sudo rm /usr/bin/python
sudo ln -s /usr/bin/python3.6 /usr/bin/python
就可以了。
python3.6对应anaconda 3.6。官网只有3.7没有旧版本。通过清华镜像源下载。https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
下载以后进入anaconda下载目录。终端输入
sudo bash Anaconda3-5.2.0-Linux-x86_64.sh
安装过程参考以下博文
https://blog.csdn.net/Lucky_yw/article/details/89387073
然后给anaconda 换成清华源
sudo gedit ~/.condarc
删除全部内容更改为:
channels:
- defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
创建新环境
conda create -n myenv python=3.6
进入此环境
source activate myenv
安装pytorch, torchvision
conda install pytorch
conda install torchvision
输入python,再输入import pytorch,没什么问题。搞定