一句話搞懂hadoop分區分組的不同

分組發生在reducetask階段,分組是針對同一個區的數據進行分組。分組的目的是爲了讓不同組的數據進入reduce進行處理。
分區發生在maptask階段,分區的目的是爲了讓數據進入哪個reducetask。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章