【開發環境搭建】1.linux系統下Anaconda的安裝


Anaconda是一個完整的開源的有6百萬用戶的科學計算包。想要學習R或python來快速進入data science領域,搭建常用科學計算環境首選anaconda。Anaconda支持Linux,Macos和Windows,有1000多個數據處理包可供使用,並且提供了Conda的安裝包及環境管理工具。有兩種版本Anaconda和Miniconda都支持Conda。選則那個按個人需求來選。

1、Anaconda vs Miniconda:

在這裏插入圖片描述
如上圖所示:兩者都具有Conda這個包和環境管理工具以及python,差別就是Miniconda只有一些基礎的包,而anaconda則還有許多高質量的包,這些包同樣可以通過使用conda來爲Miniconda安裝。所以有以下總結:

1.1、選擇Anaconda的原因:

  • 使用python 或 conda的新手
  • 喜歡一次性把150多個高質量的包全部安裝,建一個基本萬能的環境
  • 有足夠大的硬盤空間,不再意安裝佔用空間
  • 不願意一個一個包的安裝

1.2、選擇Miniconda的原因:

  • 願意自己按需求來安裝
  • 硬盤空間有限,省一點算一點
  • 想快點安裝完,不用大而全,後期可以自己試

綜合以上,我個人選擇miniconda。

2、Conda介紹

Conda官網上可以看到,它是一個開源的 ”package and environment management system that run on Windows,Mac OS and linux“:

  • Conda能快速安裝、運行、更新軟件包以及它們的依賴包
  • Conda能創建、保存、加載、切換各個項目特定的開發環境
  • 雖然Conda是爲python而創建的,但是Conda可以爲任何其它語言比如R,Ruby,Lua,Scala,Java,JavaScript,C,C++,FORTRAN等進行打包及分發。
    Conda作爲一個安裝包和環境管理工具,可能幫助搜索並安裝你所需要的包。如果要換python的版本,只需要有conda切換到另一個合適的環境。

2.1、包和環境管理工具介紹:

安裝軟件比較困難耗時,特別是科學計算的包。常用系統自帶安裝工具有以下不足:

  • 對於特定的研究項目,比較難指定任意自己需要的安裝包及版本
  • 不能同時在同一個環境中安裝不同版本的同一個軟件
  • 同一個軟件,對某一個項目要升級,但升級後另外一個項目不能使用
    一個環境,不同項目,需求不同,很難普適。

所以最好的方法就是爲每個項目創建各自獨立的開發環境

2.1.1、安裝包的管理工具

好的安裝包管理可以簡化安裝過程:

  • 自動識別軟件版本的兼容性,並安裝相關依賴項
  • 方便處理軟件升級
    對於linux系統常用的是 ubuntu的apt,CentOS的yum;蘋果系統的home brew ;windows沒有標準的安裝包管理工具。
    在科學運算中,對於腳本語言比如python,R,等,有好多第三方包需要管理;pip是python包的默認管理工具;install.packages是R的默認管理包。

2.1.2、環境的管理工具

環境管理工具可以解決許多常見工程師遇到的問題:

  • 你的工程需要不同版本的python(R)
  • 你的工程中的某些應用未來將不受支持,不能正常工作
  • 聯合工作,代碼共有時,可以在你的機器上工作,但不能在你的夥伴的電腦上工作

環境管理能使用設置特定的開發環境,配套的軟件本及相關的依賴包。

  • 環境管理工具可以爲不同項目創建不同的環境及相關依賴
  • 在單個項目中可以找到所有需要軟件包並且可復現
  • 使用戶在沒有管理員權限的機器上安裝軟件

2.2、需要Conda安裝包和環境管理工具的原因

在衆多的軟件包管理工具中,conda 是少有的適用於數據科學研究的工具,它有以下特徵:

  • conda提供預編譯安裝包,不需要處理編譯器的問題。比如Tensorflow,簡單一條命令就可以安裝,不用從源碼編譯。
  • conda是跨平臺的,支持linux,mac os,windows;同時支持不同的件平臺比如x86,power8或power9;支持導出環境配置參數,提供給別人,來實現同樣的配置。
  • conda支持類似pip的包管理功能
    Conda 還提供了數據科學常用的包和工具,比如R,numpy,scipy,matplotlib,keras,pandas,經過優化的tensorflow;還有硬件指定的軟件,比如 intel 的MKL, NVIDIA的CUDA。
    Anaconda提供數據表明,用conda安裝的Tensorflow比pip安裝的快8倍。

在這裏插入圖片描述
使用conda安裝tensorflow的方法參見博客

2.3 安裝conda

查看conda

which conda

在這裏插入圖片描述
已經安裝conda 就會找到安裝的絕對路徑,沒有安裝建議安裝miniconda,包含了conda和少量的python包,適合自己按需安裝自己項目所需的環境。
如果確實想要用完整的安裝包:

conda create --name my-anaconda-env anaconda=5.3

在這裏插入圖片描述
所有要安裝的包都會列出來,有好多。
確保conda是最新版本:

#更新
conda update -y conda
#驗證並查看版本號
conda info
#直接查看版本
conda --version

在這裏插入圖片描述

3、Miniconda安裝

官網選擇合適版本進行下載,複製鏈接地址:

wget -c  https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh  # -c保證斷點下載

在這裏插入圖片描述

bash Miniconda3-latest-Linux-x86_64.sh

回車,接接空格,輸入yes,接受條例,然後會出現:
在這裏插入圖片描述
有三個選項,通常直接回車完事,以後所有虛擬環境都安裝在默認環境,但如是默認環境存儲空間有限,可以自己指定路徑。
然後一路回車,直到:
在這裏插入圖片描述
輸入yes.
在這裏插入圖片描述
關閉shell,安裝生效。
生效後,輸入:

conda config --set auto_activate_base false

否則,每次登陸,anaconda base都是激活的狀態。
在這裏插入圖片描述
安裝完成。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章