"Exception: Python in worker has different version xx than that in driver xxx

即问题原因是pyspark的python环境与driver也就是主节点的python环境版本不一致


spark-submit提交程序,如若还是这个问题

在python代码中添加

import os
os.environ['PYSPARK_PYTHON']='/usr/local/bin/pythonXXX' 

即可运行


也可以在/etc/spark/conf/spark-env.sh中添加如下代码,就无需在python代码中添加环境变量了

这里写图片描述

export PYSPARK_PYTHON=/usr/bin/python
export PYSPARK_DRIVER_PYTHON=/usr/bin/python
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章