Pyspark 導入第三方包報錯

pyspark導入第三方包的方式

  1. 在spark-submit時添加參數 --py-files
    spark-submit --py-files 文件1或py文件1,zip文件2或py文件2(多個文件用,分開)
  2. 在sparkContext中使用addPyFile
    sc.addPyFile(“xxxx.zip”)

    spark.sparkContext.addFile(“xxx.zip”)

報錯

ImportError: (‘No module named numpy’, <function subimport at 0xf45c80>, (‘numpy’,))

比如我要提交的時numpy包,首先通過將numpy包打包成.zip文件,然後用上述方法導入,但是依然報ImportError,找不到包。

原因:打包方式出錯了。
在這裏插入圖片描述
zip文件的內容一打開必須形如上圖,不能在這些文件的上一級再套一個文件夾

發佈了58 篇原創文章 · 獲贊 18 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章