HiveSQL優化之where:將最大數據量的條件放在where最後
今天在hive2測試了一下查詢400多萬的數據量,兩個條件分別爲account和calc_date
select count(*) from tb_test where account = '123456' and calc_date = '2019-09-01'
和
select count(*) from tb_test where calc_date = '2019-09-01' and account = '123456'
分別測試了十次,最終平均時間分別如下:
注:僅代表當時的測試,不代表全部。