安裝原文:https://blog.csdn.net/w417950004/article/details/77203501
按照上面的安裝教程碰到了一些問題,在這裏總結一下:
1、下面的文件要裝齊,scala、Hadoop、spark、jdk要注意對應版本。上面教程裏百度雲失效,我打包在了這裏:
鏈接:https://pan.baidu.com/s/1EYWD2L5Yqrzrc7RoiPNlHg 密碼:p0j6
如果沒有裝scala,在cmd下spark-shell將會無法啓動!
2、JDK安裝路徑文件夾不能存在空格,否則會報錯'Files\spark-2.3.1-bin-hadoop2.7\jars""\' 不是內部或外部命令,也不是可運行的程序 或批處理文件。像下面這樣就存在空格了:
如果報錯卸載重新安裝到一個沒有空格的文件夾下即可。
spark-shell
pyspark