開發環境:
GPU: NVIDIA TITAN XP
OS:Xubuntu 18.04
新裝系統,沒有NVIDIA顯卡驅動。先卸載已有驅動
sudo apt-get remove --purge nvidia*
安裝庫
sudo apt-get update
sudo apt-get install dkms build-essential linux-headers-generic
禁用nouveau
sudo vim /etc/modprobe.d/blacklist.conf
輸入:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
接着終端輸入:
echo options nouveau modeset=0
sudo update-initramfs -u
重啓. 如果運行如下指令沒用打印出任何內容, 恭喜你, 禁用nouveau成功了.
lsmod | grep nouveau
補一些庫
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
我沒有自行安裝驅動。直接下了cuda10一起安了。CUDA10 下載頁面:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal
按照頁面所述代碼,下載並安裝CUDA10:
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run
因爲沒有驅動,我就一併安裝了。
安裝成功後,設置環境變量。
運行命令
sudo gedit ~/.bashrc
將以下命令寫入文件最後
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
注:關於這個環境變量,我也比較疑惑。寫成下面內容也可以:
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存退出,輸入命令:source ~/.bashrc ,重啓生效。(我沒重啓也可以)
驗證是否生效,執行
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
報錯:無法make,提示找不到nvscibuf.h。打開/usr/local/cuda/samples/1_Utilities/deviceQuery文件下的Makefile(gedit就行),第41行改爲:
FILTER_OUT := 0_Simple/cudaNvSci/Makefile
出現Result = PASS則表示安裝成功通過
然後安裝cudnn
CUDA 10.2對應cudnn版本7.5.6 下載頁面如下:
https://developer.nvidia.com/rdp/cudnn-download
記得註冊登錄。威信就能註冊。很方便
官網安裝教程
- Navigate to your <cudnnpath> directory containing the cuDNN Tar file. 進入到cudnn下載目錄
- Unzip the cuDNN package.解壓cudnn壓縮包
$ tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
- Copy the following files into the CUDA Toolkit directory, and change the file permissions.將下列文件拷貝到CUDA Toolkit目錄,更改文件權限
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 $ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
我看有的博客上還加了一句
sudo chmod a+r /usr/local/cuda/include/cudnn.h
命令行下輸入mysql --help如果是輸出一串幫助提示的話,那麼cudnn就安裝好了
這個時候該安裝anaconda了。終端輸入python,發現默認python是2.7。查看系統python版本
ls /usr/bin/python*
查看Python的指向
ls -l /usr/bin/ | grep python
可以看到python -> python2.7
,所以要把它指向下面那個Python3.6
刪除原來的軟鏈接,建立新的鏈接
sudo rm /usr/bin/python
sudo ln -s /usr/bin/python3.6 /usr/bin/python
就可以了。
python3.6對應anaconda 3.6。官網只有3.7沒有舊版本。通過清華鏡像源下載。https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
下載以後進入anaconda下載目錄。終端輸入
sudo bash Anaconda3-5.2.0-Linux-x86_64.sh
安裝過程參考以下博文
https://blog.csdn.net/Lucky_yw/article/details/89387073
然後給anaconda 換成清華源
sudo gedit ~/.condarc
刪除全部內容更改爲:
channels:
- defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
創建新環境
conda create -n myenv python=3.6
進入此環境
source activate myenv
安裝pytorch, torchvision
conda install pytorch
conda install torchvision
輸入python,再輸入import pytorch,沒什麼問題。搞定