MapReduce從它名字上來看就大致可以看出個緣由,兩個動詞Map和Reduce,“Map(展開)”就是將一個任務分解成爲多個任務,“Reduce”就是將分解後多任務處理的結果彙總起來,得出最後的分析結果。這不是什麼新思想,其實它的本質就是一種“分治法”的思想,把一個巨大的任務分割成許許多多的小任務單元,最後再將每個小任務單元的結果彙總,並求得最終結果。在分佈式系統中,機器集羣就可以看作硬件資源池,將並行的任務拆分,然後交由每一個空閒機器資源去處理,能夠極大地提高計算效率,同時這種資源無關性,對於計算集羣的擴展無疑提供了最好的設計保證。任務分解處理以後,那就需要將處理以後的結果再彙總起來,這就是Reduce要做的工作。
mapreduce原理
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
VoIP工作原理及術語解釋
風雨無阻827054
2019-02-23 13:14:57
linux操作系統原理
335729167
2019-02-23 13:00:11
hadoop一步步入門
lcyuanjiang
2019-02-23 13:59:15
hadoop搭建之hive安裝
伊人心
2019-02-23 00:41:25
(第3篇)HDFS是什麼?HDFS適合做什麼?我們應該怎樣操作HDFS系統?
I加加
2019-02-23 00:38:18
(第2篇)一篇文章教你輕鬆安裝hadoop
I加加
2019-02-23 00:37:53
(第6.1篇)大數據發展背後的強力推手——HBase分佈式存儲系統
I加加
2019-02-23 00:37:53
(第8篇)實時可靠的開源分佈式實時計算系統——Storm
I加加
2019-02-23 00:37:53
(第7篇)靈活易用易維護的hadoop數據倉庫工具——Hive
I加加
2019-02-23 00:37:51
(第4篇)hadoop之魂--mapreduce計算框架,讓收集的數據產生價值
I加加
2019-02-23 00:37:51
(第1篇)什麼是hadoop大數據?我又爲什麼要寫這篇文章?
I加加
2019-02-23 00:37:51
(第9篇)大數據的的超級應用——數據挖掘-推薦系統
I加加
2019-02-23 00:37:50
(第5篇)避免協作衝突--簡單易接入的Zookeeper
I加加
2019-02-23 00:37:50
hadoop 完全分佈式搭建(帶配置文件)
wangyudiwang
2019-02-23 00:37:11