服務器從0開始安裝系統以及配置深度學習環境

一、下載ubuntu18.04系統鏡像文件
http://mirrors.aliyun.com/ubuntu-releases/18.04/
二、製作系統盤(u盤)
下載系統盤製作軟件UltraISO:UltraISO官方下載地址:http://cn.ultraiso.net/xiazai.html   (軟件試用即可無需破解)
製作步驟參考:https://blog.csdn.net/qq_35379989/article/details/78934594
三、啓動服務器,安裝系統,按照流程走就ok了,
    查看IP地址的命令:ifconfig -a
    使用上述命令之前需要先:sudo apt-get update(更新)
                     sudo apt install net-tools
    安裝vim:sudo apt-get install vim
四、在Ubantu18.04上開啓ssh服務,實現遠程連接
     a、首先更新源列表:sudo apt-get update
     b、安裝openssh-client
    在終端中輸入: sudo apt-get install openssh-client
     c、sudo apt-get install -y openssh-server或者sudo apt-get install openssh sever
     d、啓動ssh服務
    在終端中輸入:sudo service ssh start
     e、可以查看是否啓動成功
    在終端中輸入:sudo ps -e | grep ssh
     f、使用xshell連接,具體操作省略。
五、安裝Nvidia驅動的操作步驟:
    1、sudo apt-get purge nvidia-*  //刪除可能存在的已有驅動
    2、關閉:nouveau
         echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf (一起執行)
    3、sudo update-initramfs -u  //更新配置文件
    4、重啓:sudo reboot
    5、sudo add-apt-repository ppa:graphics-drivers/ppa   //添加Graphic Drivers PPA
         sudo apt-get update
         sudo reboot
    6、查看需要下載驅動版本的代碼:ubuntu-drivers devices
    7、安裝nvidia驅動:sudo apt-get install nvidia-430(後面的數字是根據實際情況來選擇,有可能中間還會有server,例如:nvidia-driver-396)
    8、查看安裝成功與否:sudo nvidia-smi
六、安裝CUDA(18.04)
    1、安裝前的配置更改:
        1、由於CUDA 9.0僅支持GCC 6.0及以下版本,而Ubuntu 18.04預裝GCC版本爲7.3,所以需要gcc降級,查看gcc和g++版本號:gcc -v ;g++ -v 
        2、下載gcc4.8:sudo apt-get install gcc-4.8
                      sudo apt-get install g++-4.8
        3、裝完後進入到/usr/bin目錄下執行:ls -l gcc*
             會顯示以下結果:lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3
        4、發現gcc鏈接到gcc-7.0, 需要將它改爲鏈接到gcc-4.8,方法如下:
            sudo mv gcc gcc.bak #備份
            sudo ln -s gcc-4.8 gcc #重新鏈接
        5、同理,對g++也做同樣的修改:ls -l g++*
            sudo mv g++ g++.bak
            sudo ln -s g++-4.8 g++
        6、再查看gcc和g++版本號,均顯示gcc version 4.8 ,說明gcc 4.8安裝成功。
    2、安裝cuda ,及其補丁
        1、首先,根據cuDNN 的版本,目前,較爲完善的,是cuDNN v7.0.5 ,其適用於 CUDA 9.1 版本,所以,咱們在選擇安裝cuda的時候,選擇 CUDA 9.1:官網地址:https://developer.nvidia.com/cuda-91-download-archive?            target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
        2、安裝cuda主文件:sudo sh cuda_9.1.85_387.26_linux.run
            需要注意的是,之前已經安裝過顯卡驅動程序,故在提問是否安裝顯卡驅動時選擇no,其他 選擇默認路徑或者yes即可。即第二次出現選項時選擇n
        3、和主文件一樣,依次安裝3個補丁文件:例如sudo sh cuda_9.1.85.1_linux.run
        4、安裝完畢之後,將以下兩條加入.bashrc文件中,該文件在主目錄中,可以自行查找:
            打開該文件:sudo vim ~/.bashrc

            然後輸入下面2行命令:
            export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}  #注意,根據自己的版本,修改cuda-9.2/9.0...

        export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  #注意,根據自己的版本,修改cuda-9.2/9.0...
        5、最後執行:source ~/.bashrc    有時候也需要重啓。
七、安裝cuDnn(18.04)
    1、進入cudnn官網下載文件(需要註冊才能下載):https://developer.nvidia.com/rdp/cudnn-archive
         下載的文件有,版本根據實際情況修改:
                       libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
         libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
         libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
    2、安裝以上文件:安裝命令
        sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
        sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
        sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
    3、測試是否成功,依次運行如下命令:
        cp -r /usr/src/cudnn_samples_v7/ $HOME
        cd $HOME/cudnn_samples_v7/mnistCUDNN
        make clean && make
        ./mnistCUDNN
    最終如果有提示信息:“Test passed! ”,則說明安裝成功。
八、安裝深度學習環境,參考:https://blog.csdn.net/Charlotte_android/article/details/81508656
    安裝完anacond時,需要配置環境,才能使用conda下載包
    1、使用命令:vim ~/.bashrc 修改環境變量
    2、在文本最後添加命令:export PATH=~/anaconda3/bin:$PATH
    3、重啓環境變量:source ~/.bashrc
九、設置靜態ip
    因爲Ubuntu18.04採用的是netplan來管理network。在/etc/netplan/目錄下有一個缺省文件:01-network-manager-all.yaml,我們可以自己爲網卡再建一個文件,也可直接修改這個文件。比如01-netplan.yaml文件
    打開它,然後在此文件下寫入以下配置:
network:
  version: 2
  renderer: networkd
    ethernets:
        enp0s31f6:
            addresses: [192.168.2.41/24]
            dhcp4: false
            optional: true
            gateway4: 192.168.2.1
            nameservers:
                addresses: [8.8.8.8]
    注意點:
    1.以上配置文件共11行,其中第2,3行可以不寫,測試過沒有這2行,網絡也能工作正常,第5行的"enp0s31f6"爲虛擬網卡,可以使用ifconfig -a查看本機的網卡進行更改,注意更改的是冒號前面的名稱,後面沒有東西。addresses裏的ip就是你想設置的靜態ip。
    2.配置文件裏在冒號:號出現的後面一定要空一格,不空格則在運行netplan apply時提示出錯。
    3.關鍵是看清配置總共分爲多個層級,逐層向後至少空一格,
    例如:

network:
  version: 2
  ethernets:
          enp0s31f6:
                  addresses: [192.168.2.83/24]
                  dhcp4: false
                  gateway4: 192.168.2.177
                  nameservers:
                          addresses: [8.8.8.8]

也可參考:https://blog.csdn.net/qq_42975842/article/details/81705244
最後執行生效:sudo netplan apply

十、禁止系統內核自動升級

安裝好系統與環境以後,機器容易在關機時自動升級內核版本,導致nvidia驅動版本與內核版本不匹配,無法使用gpu,出現如下錯誤:NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver。解決辦法有2個:

       1、禁止內核更新,運行命令:sudo apt-mark hold linux-image-4.4.0-145-generic (其中的內核版本是與能夠運行gpu的內核版本相一致);

       2、命令行關閉系統自動更新,使用命令打開文件並編輯:sudo vim /etc/apt/apt.conf.d/10periodic

APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "1";

將雙引號中的“1”全部置“0”即可,修改後保存。

如果要使用圖形界面來關閉自動更新,找到系統設置(System Settings) --> 軟件更新(Software & Updates) 

將 Automatically check for updates 一欄選擇爲:Never

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章