"Exception: Python in worker has different version xx than that in driver xxx

即問題原因是pyspark的python環境與driver也就是主節點的python環境版本不一致


spark-submit提交程序,如若還是這個問題

在python代碼中添加

import os
os.environ['PYSPARK_PYTHON']='/usr/local/bin/pythonXXX' 

即可運行


也可以在/etc/spark/conf/spark-env.sh中添加如下代碼,就無需在python代碼中添加環境變量了

這裏寫圖片描述

export PYSPARK_PYTHON=/usr/bin/python
export PYSPARK_DRIVER_PYTHON=/usr/bin/python
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章