hadoop本地運行官方Grep案例 wordCount案例

環境準備點擊此處查看

Grep案例

第一步: 在Hadoop文件夾下

mkdir input 

cp etc/hadoop/*.xml  input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar  grep  input/   output 'dfs[a-z.]+'

執行完上一句會創建一個output文件夾(裏邊有兩個文件)這個文件夾不能自己創建

 

 

輸入 cat  part-r-00000

 

 輸出結果爲符合'dfs[a-z.]+'條件的數據

 

 wordCount案例

   mkdir wcinput

          cd  wcinput

   touch wc.input(名字隨便起)

   vim wc.input

    輸入一些數據  

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

    cd .. 退回上一層

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

 

 統計出每個單詞出現的次數

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章