原创 MapReduce數據分析(5)平均值

五、MapReduce第五講:平均值(Avg) 平均值的話就是通過寫MapReduce代碼來進行數據的平均值 下面我們通過案列來講解一下吧! 案列:對聯通流量數據進行分析,要求編寫MapReduce代碼對數據處理,輸出手機號、上行

原创 MapReduce數據分析(6)共同好友

六、MapReduce第六講共同好友(Common friends) 某某社交網站,有如下用戶好友關係: A:B,C,D, F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,

原创 MapReduce數據分析(4)最大值

四:MapReduce第四講:Max(最大值) 最大值的話小編沒有什麼可以說的,我相信大家都明白,這次我就直接上案列和代碼了。 數據如下: 案列:編寫MapReduce代碼獲得每年的最高氣溫。 代碼: package demo;

原创 2、C語言從入門到精通一一變量

目錄2.1、爲什麼需要變量2.1.1、變量是程序的基本組成單位2.2、變量的介紹2.2.1、概念2.2.2、變量使用的基本步驟2.3、變量快速入門2.3.1、變量使用入門案例2.4、變量使用注意事項2.5、變量的數據類型2.6、整

原创 MapReduce數據分析(10)綜合實戰

十、MapReduce綜合實戰 綜合實戰:環境大數據 案列目的 1.學會分析環境數據文件; 2.學會編寫解析環境數據文件並進行統計的代碼; 3.學會進行遞歸MapReduce。 案例要求 要求實驗結束時,每位學生均已

原创 五、Scala從入門到精通一一函數式編程(基礎)

目錄1、 函數式編程內容及講課順序1.1、函數式編程內容1.2、函數式編程授課順序2、函數式編程內容2.1、幾個概念的說明2.2、在學習Scala中將方法、函數、函數式編程和麪向對象編程關係分析圖2.3、函數式編程小結3、爲什麼需

原创 MapReduce數據分析(1)單詞計數

一、MapReduce第一講WordCount(單詞計數) 在這裏小編做一下簡介:MapReduce計算框架。 MapReduce是面向大數據並行處理的計算模型、框架和平臺,它隱含了以下三層含義: 1)MapReduce是一個基於

原创 MapReduce數據分析(2)二次排序

二、MapReduce 第二講Secondary sort(二次排序) 接下來,我們先講一下二次排序的原理。 MR默認會對鍵進行排序,然而有的時候我們也有對值進行排序的需求。滿足這種需求一是可以再reduce階段排序收集過來的va

原创 八、Scala從入門到精通一一面向對象編程(高級特性)

目錄8.1、靜態屬性和靜態方法8.1.1、靜態屬性-提出問題8.1.2、基本介紹8.1.3、伴生對象的快速入門8.1.4、伴生對象的小結8.1.5、最佳實踐-使用伴生對象完成小孩玩遊戲8.1.6、伴生對象-apply方法8.1.7

原创 MapReduce數據分析(3)計數器

三、MapReduce第三講Counter(計數器) 在寫代碼之前我先講一下: MapReduce計數器是什麼? 計數器是用來紀錄job任務的執行進度和狀態。它的作用可以理解爲日誌,我們可以再進程中插入計數器,來紀錄數據的變化

原创 七、Scala從入門到精通一一面向對象編程(中級)

目錄7、包7.1、看一個應用場景7.2、回顧-Java包的三大作用7.3、回顧-Java打包命令7.4、快速入門7.5、Scala包的基本介紹7.6、Scala包快速入門7.7、Scala包的特點概述7.8、scala包的命名7.

原创 MapReduce數據分析(8)TopN

八、MapReduce第八講TopN 本次教程主要講TreeMap方法: 在搜索引擎領域中,常常需要統計最近最熱門的K個查詢詞,這就是典型的“TopN”問題,也就是從海量查詢中統計出現頻率最高的前K個。該問題可分解成兩個MapRe

原创 三、Scala從入門到精通一一運算符

目錄3、運算符介紹3.1、算術運算符3.1.1、介紹3.1.2、算術運算符一覽圖3.1.3、案例演示3.1.4、細節說明3.1.5、課堂練習3.2、關係運算符(比較運算符)3.2.1、基本介紹3.2.2、關係運算符的一覽圖3.2.

原创 MapReduce數據分析(9)數據去重

九、MapReduce第九講數據去重() 實現原理分析: map函數數將輸入的文本按照行讀取, 並將Key–每一行的內容 輸出 value–空。 reduce 會自動統計所有的key,我們讓reduce輸出key-

原创 MapReduce數據分析(7)Join操作

七、MapReduce第七講合表(Join操作) 通俗的講就是把兩個文件的內容合到一塊。話不多說,我直接上案列 一、準備兩個數據文件: data.txt: 201001 1003 abc 201002 1005 def 2010