官網地址:http://spark.apache.org/docs/latest/cluster-overview.html
Glossary術語表
標黃色的代表比較重要
術語 | 描述 |
---|---|
Application | 由driver program和集羣上的executors組成 |
Application jar | 用戶創建的spark應用程序。所依賴的jar包在運行時傳入 |
Driver program | 就是我們寫的main方法以及內部包含一個SparkContext對象 |
Cluster manager | 一個外部的服務,專門向集羣申請資源 |
Deploy mode | 區分driver進程是跑在哪裏?集羣內還是集羣外 |
Worker node | 相當於Yarn上的NodeManager |
Executor | 相當於Yarn上的container,每個應用程序都由他們自己的executors |
Task | 工作單元,運行在executor中,一個partition對應一個task |
Job | 一個action就會有一個job |
Stage | 有Shuffle就會產生Stage |
一般情況下:
一個application:包含1到n個job
一個job :包含1到n個stage構成
一個stage: 包含1到n個task