利用MapReduce進行單詞計數WordCount的過程圖示詳解

利用MapReduce進行單詞計數WordCount的過程如下:

(1)首先是讀取文件,對文件按偏移量拆分。

分割過程

(2)自定義Map,將value拆分成單詞,作爲新的key。value是原每條句子中,拆分出來單詞的出現頻率。

執行Map函數

(3)sort部分按字典順序排序,combine將map中間階段進行合併。

 

(4)Reduce端先進行合併排序,得到value list。再使用用戶定義的Reduce方法,將value list裏的值相加,得到輸出。

Reduce端排序及輸出結果

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章