【開窗】取最近直播標題和直播時長

問題描述:

一張表:test_over(uid, title, stime, etime, date)

字段comment:主播ID,直播間標題,開始直播時間戳,結束直播時間戳,日期分區

問題:求每個主播當天最近一次直播記錄和全天總的直播時長

要求: shuffle次數最少


思路:

粒度是主播;時間週期是每天;需求是兩個,第一,當天最近一次直播記錄,第二全天總的直播時長;要求shuffle次數最低;


數據準備:

數據準備

create table test_over(

uid int comment '主播ID'

,title varchar(50) comment '直播間標題'

,stime int comment'開始直播時間戳'

,etime int comment'結束直播時間戳'

,mdate date comment'日期分區'

);

 

insert overwrite table test_over

select 1,'直播1',1591607704,1591609704,'2020-06-08'

union all

select 1,'直播2',1591617204,1591621204,'2020-06-08'

union all

select 1,'直播3',159

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章