pytorch版本
博主剛開始安裝的pytorch版本爲1.2.0,但是所跑的pytorch程序是在0.4.0版本下寫的,結果運行時出現了一些問題,必須改裝較低版本的pytorch——這裏選擇了0.4.1。
下載鏈接:
https://pytorch.org/get-started/previous-versions/
下載後,得到安裝包.tar.bx2,可以使用下述指令進行本地安裝:
$ conda install --use-local pytorch-0.4.1-py36_cuda8.0.61_cudnn7.1.2_1.tar.bz2 #具體根據下載的安裝包來確定
安裝完成後還要安裝torchvision:
$ conda install pytorch torchvision cudatoolkit=8.0 -c pytorch
同時,這裏可以看到安裝包的文件名也告訴了我們應該下載的cuda和cudnn的版本。
cuda版本
pytorch版本降低,對應地,cuda版本也要降低,這裏使用cuda8.0
https://developer.nvidia.com/cuda-toolkit-archive
linux系統18.04也可以使用16.04的cuda,向下兼容。
兩種下載方法——runfile和local安裝,筆者使用前者失敗,被告知沒有cuda toolkit,安裝失敗。
使用local的deb文件安裝,但是使用nvcc -V無法識別,
修改環境變量
網上的大部分教程都在告知我們需要將cuda/lib添加到環境變量中,
這裏我們添加到bashrc文件中
$ sudo vim ~/.bashrc
export PATH="/usr/local/cuda-8.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:$LD_LIBRARY_PATH"
但是,之後輸入nvcc -V 命令行還是顯示:
Command 'nvcc' not found, but can be installed with:
apt install nvidia-cuda-toolkit
這是由於環境變量的修改沒有立即生效,可以使用
$ source ~/.bashrc
使修改立即生效,效果顯著
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61
可參考:https://www.cnblogs.com/joshua317/p/6899057.html 瞭解三種環境變量的具體設置方法。
其他常用操作
pytorch、cuda和cudnn的安裝檢測
import torch
# 若正常則靜默
a = torch.tensor(1.)
# 若正常則靜默
a.cuda()
# 若正常則返回 tensor(1., device='cuda:0')
from torch.backends import cudnn
# 若正常則靜默
cudnn.is_available()
# 若正常則返回 True
cudnn.is_acceptable(a.cuda())
# 若正常則返回 True