hive distict 和 count 操作reducer只有一個的問題

select count(distinct *) from table;

這樣寫會生成一個job 只有一個reducer執行,可以改爲如下:

select count(*) from (

select distinct * from table) t;

這樣生成兩個job,可有多個reducer執行,效率提升

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章