點擊鏈接:筆記原文(同步更新)
筆記目錄如下:
-MapReduce定義
-MapReduce優缺點
--優點
---MapReduce易於編程
---良好的擴展性
---高容錯性
---適合PB級以上海量數據的離線處理
--缺點
---不擅長實時計算
---不擅長流式計算
---不擅長DAG (有向圖)計算
-MapReduce進程
-官方WordCount源碼
-常用數據序列化類型
-MapReduce編程規範
-- Mapper階段
--Reducer階段
--Driver階段
-WordCount案例實操
--需求
--需求分析
--環境準備
--編寫程序
---編寫Mapper類
---編寫Reducer類
---編寫Driver驅動類
--本地測試
--集羣上測試實現步驟
--在Windows上向集羣提交任務實現步驟