v>
第二步:進入submitStage(),查看下方submitMissingTasks()這一段代碼,與任務Task劃分有關
匹配階段shuffleMapStage or ResultStage
每個case中的new Task的個數,即爲任務的個數
Task個數與map映射的size有關
map的size取決於partitionsToCompute的結果
DAGSchedluer.scala
DAGSchedluer.scala的submitMissingTasks方法
第三步:進入partitionsToCompute,複製findMissingPartitions,因爲findMissingPartitions是stage的屬性,stage此時爲ResultStage(以ResultStage爲例),因此後退,點擊ResultStage,搜索findMissingPartitions
DAGSchedluer.scala
其中job.numPartitions是來自於當前階段最後一個RDD的分區數