v>
第二步:进入submitStage(),查看下方submitMissingTasks()这一段代码,与任务Task划分有关
匹配阶段shuffleMapStage or ResultStage
每个case中的new Task的个数,即为任务的个数
Task个数与map映射的size有关
map的size取决于partitionsToCompute的结果
DAGSchedluer.scala
DAGSchedluer.scala的submitMissingTasks方法
第三步:进入partitionsToCompute,复制findMissingPartitions,因为findMissingPartitions是stage的属性,stage此时为ResultStage(以ResultStage为例),因此后退,点击ResultStage,搜索findMissingPartitions
DAGSchedluer.scala
其中job.numPartitions是来自于当前阶段最后一个RDD的分区数