RDD的任務劃分

RDD任務切分中間分爲:Application、Job、Stage和Task。Application->Job->Stage-> Task每一層都是1對n的關係。
1)Application:初始化一個SparkContext即生成一個Application一般一個spark程序就是一個任務。
2)Job:一個Action算子就會生成一個Job,一個spark程序會有多個行動Action算子,所以一個Application會對應多個任務。
3)Stage:根據RDD之間的依賴關係的不同將Job劃分成不同的Stage,遇到一個寬依賴則劃分一個Stage。
4)Task:Stage是一個TaskSet,將Stage劃分的結果發送到不同的Executor執行即爲一個Task。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章