一、下載ubuntu18.04系統鏡像文件
http://mirrors.aliyun.com/ubuntu-releases/18.04/
二、製作系統盤(u盤)
下載系統盤製作軟件UltraISO:UltraISO官方下載地址:http://cn.ultraiso.net/xiazai.html (軟件試用即可無需破解)
製作步驟參考:https://blog.csdn.net/qq_35379989/article/details/78934594
三、啓動服務器,安裝系統,按照流程走就ok了,
查看IP地址的命令:ifconfig -a
使用上述命令之前需要先:sudo apt-get update(更新)
sudo apt install net-tools
安裝vim:sudo apt-get install vim
四、在Ubantu18.04上開啓ssh服務,實現遠程連接
a、首先更新源列表:sudo apt-get update
b、安裝openssh-client
在終端中輸入: sudo apt-get install openssh-client
c、sudo apt-get install -y openssh-server或者sudo apt-get install openssh sever
d、啓動ssh服務
在終端中輸入:sudo service ssh start
e、可以查看是否啓動成功
在終端中輸入:sudo ps -e | grep ssh
f、使用xshell連接,具體操作省略。
五、安裝Nvidia驅動的操作步驟:
1、sudo apt-get purge nvidia-* //刪除可能存在的已有驅動
2、關閉:nouveau
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf (一起執行)
3、sudo update-initramfs -u //更新配置文件
4、重啓:sudo reboot
5、sudo add-apt-repository ppa:graphics-drivers/ppa //添加Graphic Drivers PPA
sudo apt-get update
sudo reboot
6、查看需要下載驅動版本的代碼:ubuntu-drivers devices
7、安裝nvidia驅動:sudo apt-get install nvidia-430(後面的數字是根據實際情況來選擇,有可能中間還會有server,例如:nvidia-driver-396)
8、查看安裝成功與否:sudo nvidia-smi
六、安裝CUDA(18.04)
1、安裝前的配置更改:
1、由於CUDA 9.0僅支持GCC 6.0及以下版本,而Ubuntu 18.04預裝GCC版本爲7.3,所以需要gcc降級,查看gcc和g++版本號:gcc -v ;g++ -v
2、下載gcc4.8:sudo apt-get install gcc-4.8
sudo apt-get install g++-4.8
3、裝完後進入到/usr/bin目錄下執行:ls -l gcc*
會顯示以下結果:lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3
4、發現gcc鏈接到gcc-7.0, 需要將它改爲鏈接到gcc-4.8,方法如下:
sudo mv gcc gcc.bak #備份
sudo ln -s gcc-4.8 gcc #重新鏈接
5、同理,對g++也做同樣的修改:ls -l g++*
sudo mv g++ g++.bak
sudo ln -s g++-4.8 g++
6、再查看gcc和g++版本號,均顯示gcc version 4.8 ,說明gcc 4.8安裝成功。
2、安裝cuda ,及其補丁
1、首先,根據cuDNN 的版本,目前,較爲完善的,是cuDNN v7.0.5 ,其適用於 CUDA 9.1 版本,所以,咱們在選擇安裝cuda的時候,選擇 CUDA 9.1:官網地址:https://developer.nvidia.com/cuda-91-download-archive? target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
2、安裝cuda主文件:sudo sh cuda_9.1.85_387.26_linux.run
需要注意的是,之前已經安裝過顯卡驅動程序,故在提問是否安裝顯卡驅動時選擇no,其他 選擇默認路徑或者yes即可。即第二次出現選項時選擇n
3、和主文件一樣,依次安裝3個補丁文件:例如sudo sh cuda_9.1.85.1_linux.run
4、安裝完畢之後,將以下兩條加入.bashrc文件中,該文件在主目錄中,可以自行查找:
打開該文件:sudo vim ~/.bashrc
然後輸入下面2行命令:
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}} #注意,根據自己的版本,修改cuda-9.2/9.0...
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} #注意,根據自己的版本,修改cuda-9.2/9.0...
5、最後執行:source ~/.bashrc 有時候也需要重啓。
七、安裝cuDnn(18.04)
1、進入cudnn官網下載文件(需要註冊才能下載):https://developer.nvidia.com/rdp/cudnn-archive
下載的文件有,版本根據實際情況修改:
libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
2、安裝以上文件:安裝命令
sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
3、測試是否成功,依次運行如下命令:
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
最終如果有提示信息:“Test passed! ”,則說明安裝成功。
八、安裝深度學習環境,參考:https://blog.csdn.net/Charlotte_android/article/details/81508656
安裝完anacond時,需要配置環境,才能使用conda下載包
1、使用命令:vim ~/.bashrc 修改環境變量
2、在文本最後添加命令:export PATH=~/anaconda3/bin:$PATH
3、重啓環境變量:source ~/.bashrc
九、設置靜態ip
因爲Ubuntu18.04採用的是netplan來管理network。在/etc/netplan/目錄下有一個缺省文件:01-network-manager-all.yaml,我們可以自己爲網卡再建一個文件,也可直接修改這個文件。比如01-netplan.yaml文件
打開它,然後在此文件下寫入以下配置:
network:
version: 2
renderer: networkd
ethernets:
enp0s31f6:
addresses: [192.168.2.41/24]
dhcp4: false
optional: true
gateway4: 192.168.2.1
nameservers:
addresses: [8.8.8.8]
注意點:
1.以上配置文件共11行,其中第2,3行可以不寫,測試過沒有這2行,網絡也能工作正常,第5行的"enp0s31f6"爲虛擬網卡,可以使用ifconfig -a查看本機的網卡進行更改,注意更改的是冒號前面的名稱,後面沒有東西。addresses裏的ip就是你想設置的靜態ip。
2.配置文件裏在冒號:號出現的後面一定要空一格,不空格則在運行netplan apply時提示出錯。
3.關鍵是看清配置總共分爲多個層級,逐層向後至少空一格,
例如:
network:
version: 2
ethernets:
enp0s31f6:
addresses: [192.168.2.83/24]
dhcp4: false
gateway4: 192.168.2.177
nameservers:
addresses: [8.8.8.8]
也可參考:https://blog.csdn.net/qq_42975842/article/details/81705244
最後執行生效:sudo netplan apply
十、禁止系統內核自動升級
安裝好系統與環境以後,機器容易在關機時自動升級內核版本,導致nvidia驅動版本與內核版本不匹配,無法使用gpu,出現如下錯誤:NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver。解決辦法有2個:
1、禁止內核更新,運行命令:sudo apt-mark hold linux-image-4.4.0-145-generic (其中的內核版本是與能夠運行gpu的內核版本相一致);
2、命令行關閉系統自動更新,使用命令打開文件並編輯:sudo vim /etc/apt/apt.conf.d/10periodic
APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "1";
將雙引號中的“1”全部置“0”即可,修改後保存。
如果要使用圖形界面來關閉自動更新,找到系統設置(System Settings) --> 軟件更新(Software & Updates)
將 Automatically check for updates 一欄選擇爲:Never