Spark的本地模式安裝部署與初體驗

原創

2020-05-13 00:18

Spark開箱即用，測試使用的是：spark-2.2.0-bin-2.6.0-cdh5.14.0版本。
下載地址：spark-2.2.0-bin-2.6.0-cdh5.14.0

下載

其他版本請訪問apache官方：http://spark.apache.org/downloads.html

local本地模式 - Spark初體驗

上傳與解壓

將壓縮包上傳至Linux後解壓

cd /export/servers
tar -zxvf ./spark-2.2.0-bin-2.6.0-cdh5.14.0.tgz -C ./

bin：可執行腳本
conf：配置文件
data：示例程序使用數據
examples：示例程序
jars：依賴jar包
python：pythonAPI
sbin：集羣管理命令
yarn：整合yarn需要的內容

啓動 spark-shell

直接啓動bin目錄下的spark-shell
說明：

直接使用 ./spark-shell表示使用local模式啓動，在本機啓動一個sparksubmit進程
還可指定參數 --master，如：
- spark-shell --master local[N]表示在本地模擬N個線程來運行當前任務
- spark-shell --master local[*]表示使用當前機器上所有可用的資源
不攜帶參數默認就是：spark-shell --master local[*]
如部署spark集羣模式，還可以使用--master spark://host:port把任務提交到集羣上運行
退出spark-shell使用：:quit

Spark初體驗 - 讀取本地文件

準備數據：vim /root/words.txt
hello me you her
hello you her
hello her
hello

val textFile = sc.textFile("file:///root/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _).collect

結果：

Array[(String, Int)] = Array((you,2), (hello,4), (me,1), (her,3))

Spark初體驗 - 讀取HDFS文件

準備數據：
將文件上傳至hdfs：hadoop fs -put /root/words.txt /wordcount/input/words.txt

val textFile = sc.textFile("hdfs://node01:8020/wordcount/input/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
counts.saveAsTextFile("hdfs://node01:8020/wordcount/output")

訪問HDFS輸出路徑查看結果

輸出爲兩個文件的原因是：spark默認的分區數量爲2個

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Spark的本地模式安裝部署與初體驗

下載

local本地模式 - Spark初體驗

上傳與解壓

啓動 spark-shell

Spark初體驗 - 讀取本地文件

Spark初體驗 - 讀取HDFS文件

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

SparkSQL與Hive整合（Spark-On-Hive）

Spark的StandAlone集羣模式安裝部署

Spark的本地模式安裝部署與初體驗

Spark的On Yarn集羣模式部署及參數詳解

Spark的StandAlone - HA高可用模式部署

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結