- 關於Geotrellis
Geotrellis是一款基於分佈式存儲和計算的柵格數據處理框架。
- 使用環境說明
1、Python
Geotrellis是基於Scala語言編程實現的,同時Geotrellis也提供了其他編程語言如Python、R語言的開發接口。由於項目的需要,這裏使用Python語言,版本選擇3.7.3,編譯器選擇pycharm2019.1。具體的安裝和部署過程參見其他教程。
2、Spark
Geotrellis使用分佈式計算,所以需要安裝Sprak。具體的安裝步驟可以參考其他教程,這裏不再說明。
Spark環境部署完成後,可以通過spark-submit的方式提交python代碼。Python使用spark需要引入spark提供的PySpark包,安裝方式:
1)使用pip
pip install pyspark
下載的使用需要指定版本,最好和安裝的spark版本一致。比如:pip install pyspark==2.2.0
2)直接下載壓縮包,地址:https://pypi.org/project/pyspark/#files
下載後使用pip install 目錄\pyspark-2.4.3.tar.gz
我使用的spark版本是2.2.0
3、GeopySpark
Python需要引入Geotrellis提供的Pytho包,下載方式同pyspark。
如:pip install geopyspark=0.2.0
下載完成後需要生成jar包
Geopyspark install -jar
Python的代碼最終會調用這些jar包,如下:
說明部署完成。注意geopyspark的版本。
我這裏使用的geopyspark版本是0.2.0
至此,基本環境已經部署完成,可以嘗試開發了。