使用Pig工具在Local模式计算系统日志access_log.txt中的IP的点击数,要求使用GROUP BY语句按照IP进行分组,通过FOREACH运算符,对关系的列进行迭代,统计每个分组的总行数,最后使用DUMP 语句查询统计结果。将查询命令和查询结果以文本形式提交到答题框中。
1.先把文件(access_log.txt)传入PIG
grunt> copyFromLocal /root/access-log.txt /log.txt
2.载入pig,并用空格分隔符,字段为qq,ww(类型为默认)
A = load '/log.txt' using PigStorege (' ') as (qq,ww);
3.按qq字段进行分组
B = group A by qq;
4.输出这个分组以及这个分组的全部
C = foreach B generate group,COUNT(A)