HBase和MapReduce

感謝平臺分享-http://bjbsair.com/2020-04-10/tech-info/53333.html

Apache MapReduce 是一個用於分析大量數據的軟件框架。它由 Apache Hadoop 提供。MapReduce 本身超出了本文檔的範圍。開始使用 MapReduce 的好地方是 https://hadoop.apache.org/docs/r2.6.0/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html。MapReduce 版本2(MR2)現在是 YARN 的一部分。

本章討論在 HBase 中對數據使用 MapReduce 時需要採取的具體配置步驟。另外,它討論了 HBase 和 MapReduce 作業之間的其他交互和問題。最後,它討論了Cascading,MapReduce 的另一種 API。

mapred 和 mapreduce

HBase 中有兩個 mapreduce 包,就像 MapReduce 本身一樣:org.apache.hadoop.hbase.mapred 和org.apache.hadoop.hbase.mapreduce。前者使用舊式 API,後者使用新模式。後者有更多的設施,儘管你通常可以在舊的包裝中找到相同的設備。選擇與MapReduce 部署配合使用的軟件包。如果有疑問或重新開始,請選擇org.apache.hadoop.hbase.mapreduce。在下面的註釋中,我們引用了oahhmapreduce,但是如果這是你正在使用的,則用 oahhmapred 替換。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章