重啓電腦,出現LOGO時一直按F2(不同類型的筆記本進入BIOS方式不同,自行百度,這裏演示的是神舟筆記本):
創建虛擬環境(YOUR_ENVS_NAME是創建的環境名,自己指定):
下載tensorflow-gpu時會自動安裝對應的cudnn庫,但是版本比較高可能出現問題,建議移除重新安裝。
7.tensorflow CUDA cudnn 版本對應關係(僅供參考)
不要着急敲命令,先瀏覽一遍~~
1.安裝雙系統(在window系統下製作)
參考:https://blog.csdn.net/u011680118/article/details/90740181
-
準備一個空u盤,確保裏面沒有任何文件
-
到ubuntu的官網下載鏡像(推薦16.0版本,比較穩定)
http://releases.ubuntu.com/16.04/
-
下載製作安裝U盤的軟件UItralISO
http://www.ezbsystems.com/ultraiso/download.htm
選擇簡體中文下載即可:
-
將U盤插入電腦,安裝UItralISO軟件並打開
選擇“文件->打開”,找到你下載的ubuntu鏡像(.iso)文件,點擊“啓動->寫入硬盤映像”:
點擊“格式化”(分配單元大小不一定是4096字節,可以選擇最大的),點擊“開始”:
格式化完成之後,點擊“關閉”,回到寫入硬盤鏡像窗口,點擊“寫入”(警告窗口點擊“是”):
當日志中顯示“刻錄成功”說明U盤製作完成。
-
爲ubuntu分配空間
win+x,選擇磁盤管理
選擇剩餘空間較大的可分配磁盤(例如E盤),右鍵並選擇“壓縮卷”,輸入準備分配的空間大小(建議50G或以上,這裏分配100G)。點擊“壓縮”之後,E盤後部出現黑色的100G“未分配空間”,用來給ubuntu使用;至此,磁盤分區過程完成。
-
禁用win10快速啓動
win+x,選擇“電源選項”:
取消選擇“啓用快速啓動”。最後點擊“保存修改”。
-
重啓電腦,出現LOGO時一直按F2(不同類型的筆記本進入BIOS方式不同,自行百度,這裏演示的是神舟筆記本):
檢查security boot是否關閉,需要關閉,即修改爲“disable"(大部分機器是關閉的,可以跳過此步驟)。插入U盤,重啓電腦,一直按F2,進入BIOS,選擇”security manager“,選擇自己的U盤,回車之後進入到如下頁面:
在這裏不要直接點install ubuntu!!!!按鍵移到 Install Ubuntu 選項,鍵盤按e, 進入命令行模式,編輯文本,在倒數第二行末尾的 quiet slash ---後面(也可能沒有 – ),添加以下內容:
acpi_osi=linux nomodeset
保存後回到上面界面,按回車執行 Install Ubuntu 命令,這時候可以順利進入安裝界面。設置好一些基本的引導信息後就結束了。
至此,雙系統安裝完畢。
2.安裝anaconda3
參考:https://blog.csdn.net/weixin_39345190/article/details/82595898
-
下載anaconda安裝包:
https://repo.continuum.io/archive/
下載完成後(一般都在”下載“文件夾中,後面幾步的下載文件也在這個文件夾):
將其移動至“home”目錄下(方便安裝,否則在命令行中使用命令“cd /目錄”進到下載文件的位置):
-
在命令行中安裝下載的.sh文件:
$sudo bash Anaconda3-5.2.0-Linux-x86_64.sh
然後,根據提示按回車繼續。
接下來,它會提示你是否接受協議,這裏直接輸入yes,再按回車即可(不要直接按回車,這樣默認是no)
Do you accept the license terms? [yes|no]
[no] >>> yes
接下來會提示你指定安裝路徑,這裏可以使用默認的,也可以自己指定。等待安裝進程完成,完成後會提示你是否要將Anaconda的安裝路徑添加到PATH環境變量中,輸入yes就好了。
在這裏如果不小心選擇了no,那麼需要使用命令行手動添加anaconda到環境變量,命令如下(不會使用vi命令的話先百度一下):
$vi .bash_profile
在最後一行加上如配置:
export PATH=/home/lrr/anaconda3/bin:$PATH
這裏/home/lrr/anaconda3/是上面自己指定安裝路徑。
然後使其生效:
$source .bash_profile
至此,安裝anaconda3完成。
-
測試安裝情況:
命令行輸入以下命令:
$anaconda-navigator
或者
$python -V
輸出python版本號說明安裝成功:
3.安裝Nvidia driver
-
查看顯卡型號:
在命令行輸入如下命令:
$sudo lshw -numeric -C display
-
下載對應版本的驅動:
https://www.nvidia.com/Download/index.aspx
搜索你的顯卡需要的驅動型號,點擊“search",下載到本地:
下載的文件即圖中的NVIDIA-Linux-x86_64-xxx.run文件(xxx表示驅動型號)。
-
禁止第三方驅動:
在命令行輸入如下命令:
$sudo gedit /etc/modprobe.d/blacklist.conf
在打開文檔的末尾,加上如下代碼:
blacklist amd76x_edac
blacklist nouveau option nouveau modset=0
#for nvidia display device install
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
更新內核並重啓:
$sudo update-initramfs -u
$sudo reboot now
-
檢測禁用是否成功:
$lsmod | grep nouveau
若沒有輸出說明禁用成功。
-
開始安裝驅動:
(將下載的驅動文件移動至home目錄下,方便安裝;否則需要使用cd命令進入下載目錄)
ctrl+alt+f2進入終端,登入用戶(賬戶名是root,密碼是root的密碼不是登錄的密碼;如果還沒有設置超級用戶root,按ctrl+alt+f7先退出,在命令行下輸入su,設置root密碼。ctrl+alt+f2重新進入終端)。將xxx.xx改成下載的對應的版本號:
$sudo service lightdm stop
$sudo bash NVIDIA-Linux-x86_64-xxx.xx.run -no-opengl-files
(有一處x config?啥的 選擇no 若是詢問是否continue,選擇continue installation)
$sudo service lightdm start
-
檢測驅動是否安裝成功:
$nvidia-smi
出現表格信息說明安裝成功。
重啓服務器之後若出現連接不上NVIDIA驅動的情況,即在終端輸入nvidia-smi出現
:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
只需輸入以下代碼:
$sudo apt-get install dkms
$sudo dkms install -m nvidia -v xxx.xx
注:xxx.xx是下載的驅動號
再次輸入nvidia-smi,恢復正常。
4.安裝cuda9.0
-
cuda下載(推薦9.0版本,使用run方式安裝):
將下載的文件移至home目錄下,方便安裝:
輸入如下命令:
$sudo sh cuda_9.0.176_384.81_linux.run
一路單擊回車,直到提示”是否爲NVIDIA安裝驅動.....?“ 選擇否,因爲已經安裝好驅動了。
cuda默認的安裝位置是/usr/local/cuda。
-
配置環境變量:
$sudo gedit /etc/profile
在文末加上如下代碼:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH
保存修改,重啓才能生效:
$sudo reboot now
-
檢測cuda是否安裝成功:
$nvcc -V
系統會輸出cuda的版本信息:
-
attention:
安裝驅動的時候,系統自帶了一個cuda,但是我們可以自己安裝新的cuda,並不影響使用:
5.安裝tensorflow-gpu 1.9.0
-
查看tensorflow-gpu的可用版本號:
$conda search tensorflow-gpu
-
創建虛擬環境(YOUR_ENVS_NAME是創建的環境名,自己指定):
$conda create -n YOUR_ENVS_NAME pyhton=3.6
這裏YOUR_ENVS_NAME設置爲tf。
-
激活該環境:
$source activate tf
-
添加conda國內鏡像(加快下載速度):
$conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
$conda config --set show_channel_urls yes
-
查看已添加的鏡像源:
$conda config --show
-
下載tensorflow-gpu:
$conda install tensorflow-gpu==1.9.0
6.安裝cudnn7.1.2
-
下載tensorflow-gpu時會自動安裝對應的cudnn庫,但是版本比較高可能出現問題,建議移除重新安裝。
$conda uninstall cudnn==7.6.4
$conda install cudnn==7.1.2
-
查看可用的cudnn版本號:
$conda search cudnn
-
另:可使用安裝文件安裝cudnn:
- 到官網https://developer.nvidia.com/rdp/cudnn-archive下載cudnn的安裝文件,注意按自己版本適配下載(可參考7中表格)。
- 從Nvidia官網上下載下來的cudnn for linux的文件格式是.solitairetheme8,想要解壓的話需要先轉成tgz格式再解壓:
cp cudnn-10.0-linux-x64-xxx.solitairetheme8 cudnn-10.0-linux-xxx.tgz tar -xvf cudnn-10.0-linux-x64-xxx.tgz
注意:xxx表示版本號。
- 解壓之後,就可以看見cuda文件夾,可在當前目錄打開終端,然後輸入以下代碼:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
-
查看是否安裝成功:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
出現下圖信息表示安裝成功:
7.tensorflow CUDA cudnn 版本對應關係(僅供參考)
參考:https://blog.csdn.net/yuejisuo1948/article/details/81043962
8.測試tensorflow-gpu:
-
在home目錄下創建test.py文件:
-
編輯文件內容:
import tensorflow as tf
with tf.device('/cpu:0'):
a=tf.constant(1,dtype=tf.float32)
b=tf.constant(2,dtype=tf.float32)
with tf.device('/gpu:0'):
c=a+b
sess=tf.Session(config=tf.ConfigProto(allow_soft_placement=False,log_device_placement=False))
sess.run(tf.global_variables_initializer())
print('gpu is run %d'%sess.run(c))
print('%s'%(tf.test.is_gpu_available()))
#tf.test.is_gpu_available() 測試gpu是否可用
-
執行test.py文件:
激活虛擬環境
$source activate YOUR_ENVS_NAME
$python test.py
-
輸出結果: