Hive 函數使用(一)(datediff,row_number,partition)

datediff: 返回天數的差值

    示例:datediff(a,b) 返回b-a的天數


row_number():對排序內容添加編號,多與over(partition by)等函數聯用


over (partition by a):進行分組,常與聚合函數sum()、count()、avg()等結合使用,實現聚合分組

    示例:  function over (paritition by a) 

                sum(b) over (paritition by a)  返回根據a進行分組的b的疊加值,如a爲日期,b爲登錄記錄,則返回每日的登錄次數。

    備註:使用的時候會有重複的現象,暫不知該如何處理11


group by:也是分組函數的一種,與partition的區別在於,group by 僅能顯示與分組有聯繫的字段

示例: group by a  ,以a字段爲基準進行分組

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章