集群上运行pyspark的坑———调用(bash)

那些踩过的坑
1 pyspark程序在集群上运行——配置文件
配置文件需要分发到各个节点:
(1)配置文件打包进zip,zip包含_int_.py文件
(2)bash 文件中配置好
bash文件
引用了其他的数据源,也要添加进bash文件在这里插入图片描述
2 包导入的问题——报错
没有解决。。。。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章