hadoop本地运行官方Grep案例 wordCount案例

环境准备点击此处查看

Grep案例

第一步: 在Hadoop文件夹下

mkdir input 

cp etc/hadoop/*.xml  input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar  grep  input/   output 'dfs[a-z.]+'

执行完上一句会创建一个output文件夹(里边有两个文件)这个文件夹不能自己创建

 

 

输入 cat  part-r-00000

 

 输出结果为符合'dfs[a-z.]+'条件的数据

 

 wordCount案例

   mkdir wcinput

          cd  wcinput

   touch wc.input(名字随便起)

   vim wc.input

    输入一些数据  

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

    cd .. 退回上一层

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

 

 统计出每个单词出现的次数

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章