Spark的核心術語

官網地址:http://spark.apache.org/docs/latest/cluster-overview.html

Glossary術語表

標黃色的代表比較重要

術語 描述
Application 由driver program和集羣上的executors組成
Application jar 用戶創建的spark應用程序。所依賴的jar包在運行時傳入
Driver program 就是我們寫的main方法以及內部包含一個SparkContext對象
Cluster manager 一個外部的服務,專門向集羣申請資源
Deploy mode 區分driver進程是跑在哪裏?集羣內還是集羣外
Worker node 相當於Yarn上的NodeManager
Executor 相當於Yarn上的container,每個應用程序都由他們自己的executors
Task 工作單元,運行在executor中,一個partition對應一個task
Job 一個action就會有一個job
Stage 有Shuffle就會產生Stage

一般情況下:
一個application:包含1到n個job
一個job :包含1到n個stage構成
一個stage: 包含1到n個task

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章