pig,練習

使用Pig工具在Local模式計算系統日誌access_log.txt中的IP的點擊數,要求使用GROUP BY語句按照IP進行分組,通過FOREACH運算符,對關係的列進行迭代,統計每個分組的總行數,最後使用DUMP 語句查詢統計結果。將查詢命令和查詢結果以文本形式提交到答題框中。

1.先把文件(access_log.txt)傳入PIG
grunt> copyFromLocal /root/access-log.txt /log.txt

2.載入pig,並用空格分隔符,字段爲qq,ww(類型爲默認)
A = load '/log.txt' using PigStorege (' ') as (qq,ww);

3.按qq字段進行分組
 B = group A by qq;
 
4.輸出這個分組以及這個分組的全部
 C = foreach B generate group,COUNT(A)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章