問題描述:
一張表:test_over(uid, title, stime, etime, date)
字段comment:主播ID,直播間標題,開始直播時間戳,結束直播時間戳,日期分區
問題:求每個主播當天最近一次直播記錄和全天總的直播時長
要求: shuffle次數最少
思路:
粒度是主播;時間週期是每天;需求是兩個,第一,當天最近一次直播記錄,第二全天總的直播時長;要求shuffle次數最低;
數據準備:
create table test_over( uid int comment '主播ID' ,title varchar(50) comment '直播間標題' ,stime int comment'開始直播時間戳' ,etime int comment'結束直播時間戳' ,mdate date comment'日期分區' ); |
insert overwrite table test_over select 1,'直播1',1591607704,1591609704,'2020-06-08' union all select 1,'直播2',1591617204,1591621204,'2020-06-08' union all select 1,'直播3',159 |