ubuntu16.04安裝tensorflow,pytorch,gluon等

  • 瀏覽器相關
  • 安裝cuda,cudnn相關
  • 編譯tensorflow相關
  • 安裝bazel相關
  • anaconda相關
  • 安裝pytorch與gluon相關

接上一篇文章“ubuntu16.04命令操作”,在其基礎上繼續進行了安裝。

#安裝chrome
1、下載谷歌瀏覽器源文件。鏈接有很多,以下是64位版本的下載地址
https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
2、下載完成後,在終端運行命令:
sudo dpkg -i google-chrome*; sudo apt-get -f install
即可安裝完成
3、直接在終端中輸入google-chrome即可運行,如提示密鑰窗口,可按下列內容執行:
終端中輸入seahorse,密碼-login-右鍵-解鎖-輸入密碼,就不會再提示了。

#卸載火狐瀏覽器
參考:https://blog.csdn.net/qq_41149269/article/details/81175948
#卸載火狐瀏覽器之後,
出現了ubuntu16.04 has experienced an internal error的報錯。解決方式是,不管它,皮~
參考:https://blog.csdn.net/xiaowei_jin/article/details/49949653按照

#安裝學習框架準備過程
按照以下鏈接的教程安裝tensorflow:
參考1:
https://mp.weixin.qq.com/s?__biz=MzUzNjE3NTgxNg==&mid=2247483863&idx=1&sn=12b2c0064d262238ca1c30d57ffdc635&chksm=fafb7470cd8cfd665f04b7a03f5f5b3cf4ac3536670329d30c58f6acaa5025cd79aae79ac526&mpshare=1&scene=1&srcid=1118EtbuZc4D1jpKVNo5Pjms#rd但是教程中有一些操作可以改進:
(1)nvidia的驅動安裝可以改爲使用使用apt-get在線安裝,
參考2:
https://mp.weixin.qq.com/s?__biz=MzUzNjE3NTgxNg==&mid=2247483947&idx=1&sn=d72bb74f698d802d436a4f1fbff26734&chksm=fafb778ccd8cfe9aab7261b0e695f9013ca55845555330974385a9cc11b0e9e287401196bdf0&mpshare=1&scene=1&srcid=1118avNy28yCznmv1eCR0MBu#rd
(2)cuda是否安裝成功
查看 CUDA安裝情況 :
首先用 cd命令切換到 命令切換到 CUDA自帶的例程目錄之下 ,
即輸入命令 cd NVIDA_CUDA9.0_Sample/1_Utilities/deviceQuery,
之後輸入 make命令
接下來輸入 ./deviceQuery命令 執行例程
並且最後一行出現 Result=PASS視爲 CUDA安裝成功
(3)本次配置使用的是cuda9.0+cudnn7.0.3,第三步之後,執行以下過程,避免了第七步的問題。
安裝完cudnn以後,要使用以下命令添加軟連接。
接着建立軟連接:
  cd /usr/local/cuda/lib64/ 
  sudo rm -rf libcudnn.so libcudnn.so.7
  sudo ln -s libcudnn.so.7.0.3 libcudnn.so.7 
  sudo ln -s libcudnn.so.7 libcudnn.so 
配置環境變量:
  sudo gedit /etc/profile
在末尾處添加:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
接着創建鏈接文件;
sudo gedit /etc/ld.so.conf.d/cuda.conf 
增加下面一行;
/usr/local/cuda/lib64 
保存後在終端輸入sudo ldconfig 使鏈接生效

#查看 CUDA cudnn 版本
https://blog.csdn.net/zhangjunhit/article/details/76532196
#安裝tensorflow
直接使用pip install tensorflow-gpu==1.8.0安裝tensorflow會報錯,應該是pip沒有相應的包。
所有要自己使用Bazel編譯tensorflow源碼安裝。使用參考1中各種軟件對應的版本是可以正確編譯tensorflow的,
這次編譯時換了python爲3.7,bazel爲0.19.1,結果各種報錯。

#編譯tensorflow時遇到的各種錯誤及解決方法
(1)出現警告:
WARNING: The following rc files are no longer being read, please transfer their contents or import their path into one of the standard rc files:/home/[user]/Downloads/tensorflow-r1.8/tools/bazel.rc
要將該路徑添加到.bazelrc
(2)編譯報錯爲:
ERROR: /home/[user]/.cache/bazel/_bazel_[user]/c7c54c19884fac535f95c7b464dd0c8b/external/local_config_cc/BUILD:57:1: in cc_toolchain rule @local_config_cc//:cc-compiler-k8: Error while selecting cc_toolchain: Toolchain identifier 'local' was not found, valid identifiers are [local_linux, local_darwin]
按照該方法解決問題:
https://stackoverflow.com/questions/53292093/how-do-i-specify-a-toolchain-identifier-when-building-tensorflow-from-source
(3)編譯報錯爲:
ERROR: Analysis of target '//tensorflow/tools/pip_package:build_pip_package' failed; build aborted: no such package '@boringssl//': java.io.IOException: Error downloading [https://mirror.bazel.build/github.com/google/boringssl/archive/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz, https://github.com/google/boringssl/archive/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz] to /home/fengzicai/.cache/bazel/_bazel_fengzicai/c7c54c19884fac535f95c7b464dd0c8b/external/boringssl/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz: Checksum was 676ed7516f47b897ce7c3a2c3a57f92f63fc86f4312293acce8932708b21d2a6 but wanted 524ba98a56300149696481b4cb9ddebd0c7b7ac9b9f6edee81da2d2d7e5d2bb3
參考鏈接:https://github.com/tensorflow/tensorflow/issues/12984

#Bazel相關
(1)使用以下命令可以升級bazel
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -sudo apt-get update && sudo apt-get install bazel 安裝
sudo apt-get update &&sudo apt-get upgrade bazel 更新
參考:https://blog.csdn.net/dlhlSC/article/details/73641039?utm_source=blogxgwz0
(2)降bazel版本
rm -fr ~/.bazel ~/.bazelrc
install bazel (version: 0.14.1, maybe others)
bazel build ...

#anaconda相關命令
(1)python3.7編譯會報錯,創建python3.6的虛擬環境進行安裝
參考:https://www.cnblogs.com/swje/p/7642929.html
(2)創建刪除虛擬環境
參考:https://blog.csdn.net/sizhi_xht/article/details/809640993)安裝navigator
參考:https://blog.csdn.net/u013372308/article/details/792353934)導出anaconda庫環境
參考:https://blog.csdn.net/vola9527/article/details/807445405)anaconda添加源和刪除源的命令
conda config --remove channels "https://mirrors.ustc.edu.cn/anaconda/pkgs/free/"

#安裝pytorch
參考:https://blog.csdn.net/u010327061/article/details/81001999
參考:https://blog.csdn.net/u013713010/article/details/78645631

#安裝gluon
下載gluon-tutorials-zh之後,將environment.yml 修改爲以下內容,就可以支持cuda9.0了。
name: gluon
dependencies:
- python>=3.6
- jupyter=1.0.0
- matplotlib=2.2.2
- pandas=0.23.2- pip:
  - requests==2.18.4
  - mxnet==1.2.1
然後在anaconda命令行下,執行
conda env create -f environment.yml 
創建名爲gluon的虛擬環境
參考:https://blog.csdn.net/qq_32458499/article/details/78701203
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章