pig,练习

使用Pig工具在Local模式计算系统日志access_log.txt中的IP的点击数,要求使用GROUP BY语句按照IP进行分组,通过FOREACH运算符,对关系的列进行迭代,统计每个分组的总行数,最后使用DUMP 语句查询统计结果。将查询命令和查询结果以文本形式提交到答题框中。

1.先把文件(access_log.txt)传入PIG
grunt> copyFromLocal /root/access-log.txt /log.txt

2.载入pig,并用空格分隔符,字段为qq,ww(类型为默认)
A = load '/log.txt' using PigStorege (' ') as (qq,ww);

3.按qq字段进行分组
 B = group A by qq;
 
4.输出这个分组以及这个分组的全部
 C = foreach B generate group,COUNT(A)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章