服務器從0開始安裝系統以及配置深度學習環境

原創

2020-06-20 17:39

一、下載ubuntu18.04系統鏡像文件
http://mirrors.aliyun.com/ubuntu-releases/18.04/
二、製作系統盤（u盤）
下載系統盤製作軟件UltraISO：UltraISO官方下載地址：http://cn.ultraiso.net/xiazai.html （軟件試用即可無需破解）
製作步驟參考：https://blog.csdn.net/qq_35379989/article/details/78934594
三、啓動服務器，安裝系統，按照流程走就ok了，
   查看IP地址的命令：ifconfig -a
   使用上述命令之前需要先：sudo apt-get update（更新）
           sudo apt install net-tools
   安裝vim：sudo apt-get install vim
四、在Ubantu18.04上開啓ssh服務，實現遠程連接
a、首先更新源列表：sudo apt-get update
b、安裝openssh-client
   在終端中輸入: sudo apt-get install openssh-client
c、sudo apt-get install -y openssh-server或者sudo apt-get install openssh sever
d、啓動ssh服務
   在終端中輸入：sudo service ssh start
e、可以查看是否啓動成功
   在終端中輸入：sudo ps -e | grep ssh
f、使用xshell連接，具體操作省略。
五、安裝Nvidia驅動的操作步驟：
   1、sudo apt-get purge nvidia-* //刪除可能存在的已有驅動
   2、關閉：nouveau
   echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf （一起執行）
   3、sudo update-initramfs -u //更新配置文件
   4、重啓：sudo reboot
   5、sudo add-apt-repository ppa:graphics-drivers/ppa //添加Graphic Drivers PPA
   sudo apt-get update
   sudo reboot
   6、查看需要下載驅動版本的代碼：ubuntu-drivers devices
   7、安裝nvidia驅動：sudo apt-get install nvidia-430（後面的數字是根據實際情況來選擇，有可能中間還會有server，例如：nvidia-driver-396）
   8、查看安裝成功與否：sudo nvidia-smi
六、安裝CUDA（18.04）
   1、安裝前的配置更改：
       1、由於CUDA 9.0僅支持GCC 6.0及以下版本，而Ubuntu 18.04預裝GCC版本爲7.3，所以需要gcc降級，查看gcc和g++版本號：gcc -v ；g++ -v
       2、下載gcc4.8：sudo apt-get install gcc-4.8
           sudo apt-get install g++-4.8
       3、裝完後進入到/usr/bin目錄下執行：ls -l gcc*
       會顯示以下結果：lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3
       4、發現gcc鏈接到gcc-7.0, 需要將它改爲鏈接到gcc-4.8，方法如下:
           sudo mv gcc gcc.bak #備份
           sudo ln -s gcc-4.8 gcc #重新鏈接
       5、同理，對g++也做同樣的修改：ls -l g++*
           sudo mv g++ g++.bak
           sudo ln -s g++-4.8 g++
       6、再查看gcc和g++版本號，均顯示gcc version 4.8 ，說明gcc 4.8安裝成功。
   2、安裝cuda ,及其補丁
       1、首先，根據cuDNN 的版本，目前，較爲完善的，是cuDNN v7.0.5 ,其適用於 CUDA 9.1 版本，所以，咱們在選擇安裝cuda的時候，選擇 CUDA 9.1：官網地址：https://developer.nvidia.com/cuda-91-download-archive?           target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
       2、安裝cuda主文件：sudo sh cuda_9.1.85_387.26_linux.run
           需要注意的是，之前已經安裝過顯卡驅動程序，故在提問是否安裝顯卡驅動時選擇no,其他選擇默認路徑或者yes即可。即第二次出現選項時選擇n
       3、和主文件一樣，依次安裝3個補丁文件：例如sudo sh cuda_9.1.85.1_linux.run
       4、安裝完畢之後，將以下兩條加入.bashrc文件中，該文件在主目錄中，可以自行查找：
           打開該文件：sudo vim ~/.bashrc

然後輸入下面2行命令：
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}} #注意，根據自己的版本，修改cuda-9.2/9.0...

       export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} #注意，根據自己的版本，修改cuda-9.2/9.0...
       5、最後執行：source ~/.bashrc 有時候也需要重啓。
七、安裝cuDnn（18.04）
   1、進入cudnn官網下載文件（需要註冊才能下載）：https://developer.nvidia.com/rdp/cudnn-archive
   下載的文件有，版本根據實際情況修改：
       libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
       libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
       libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
   2、安裝以上文件：安裝命令
       sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
       sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
       sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
   3、測試是否成功，依次運行如下命令：
       cp -r /usr/src/cudnn_samples_v7/ $HOME
       cd $HOME/cudnn_samples_v7/mnistCUDNN
       make clean && make
       ./mnistCUDNN
   最終如果有提示信息：“Test passed! ”，則說明安裝成功。
八、安裝深度學習環境，參考：https://blog.csdn.net/Charlotte_android/article/details/81508656
   安裝完anacond時，需要配置環境，才能使用conda下載包
1、使用命令：vim ~/.bashrc 修改環境變量
2、在文本最後添加命令：export PATH=~/anaconda3/bin:$PATH
3、重啓環境變量：source ~/.bashrc
九、設置靜態ip
因爲Ubuntu18.04採用的是netplan來管理network。在/etc/netplan/目錄下有一個缺省文件：01-network-manager-all.yaml，我們可以自己爲網卡再建一個文件，也可直接修改這個文件。比如01-netplan.yaml文件
打開它，然後在此文件下寫入以下配置：
network:
version: 2
renderer: networkd
ethernets:
enp0s31f6:
addresses: [192.168.2.41/24]
dhcp4: false
optional: true
gateway4: 192.168.2.1
nameservers:
addresses: [8.8.8.8]
注意點：
1.以上配置文件共11行，其中第2，3行可以不寫，測試過沒有這2行，網絡也能工作正常，第5行的"enp0s31f6"爲虛擬網卡，可以使用ifconfig -a查看本機的網卡進行更改，注意更改的是冒號前面的名稱，後面沒有東西。addresses裏的ip就是你想設置的靜態ip。
2.配置文件裏在冒號：號出現的後面一定要空一格，不空格則在運行netplan apply時提示出錯。
3.關鍵是看清配置總共分爲多個層級，逐層向後至少空一格，
例如：

network:
version: 2
ethernets:
enp0s31f6:
addresses: [192.168.2.83/24]
dhcp4: false
gateway4: 192.168.2.177
nameservers:
addresses: [8.8.8.8]

也可參考：https://blog.csdn.net/qq_42975842/article/details/81705244
最後執行生效：sudo netplan apply

十、禁止系統內核自動升級

安裝好系統與環境以後，機器容易在關機時自動升級內核版本，導致nvidia驅動版本與內核版本不匹配，無法使用gpu，出現如下錯誤：NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver。解決辦法有2個：

1、禁止內核更新，運行命令：sudo apt-mark hold linux-image-4.4.0-145-generic （其中的內核版本是與能夠運行gpu的內核版本相一致）；

2、命令行關閉系統自動更新，使用命令打開文件並編輯：sudo vim /etc/apt/apt.conf.d/10periodic

APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "1";

將雙引號中的“1”全部置“0”即可，修改後保存。

如果要使用圖形界面來關閉自動更新，找到系統設置(System Settings) --> 軟件更新(Software & Updates)

將 Automatically check for updates 一欄選擇爲：Never

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

服務器從0開始安裝系統以及配置深度學習環境

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

服務器從0開始安裝系統以及配置深度學習環境

os.environ與os.putenv的使用

operator.attrgetter()與operator.itemgetter()的用法

深度學習相關軟件安裝以及服務器操作

linux系統中文件壓縮與解壓縮操作

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結