in是把外表和內表作hash 連接,而exists 是對外表作loop 循環,每次loop 循環再對內表進行查詢。
一直以來認爲exists 比in 效率高的說法是不準確的。如果查詢的兩個表大小相當,那麼用in 和exists 差別不大。
如果兩個表中一個較小,一個是大表,則子查詢表大的用exists,子查詢表小的用in:
例如: 表A(小表),表B(大表)
1:
select * from A where cc in (select cc from B) ; 效率低,用到了A 表上cc 列的索引;
select * from A where exists(select cc from B where cc=A.cc) ; 效率高,用到了B 表上cc 列的索引。
2:
select * from B where cc in (select cc from A) ; 效率高,用到了B 表上cc 列的索引;
select * from B where exists(select cc from A where cc=B.cc) ; 效率低,用到了A 表上cc 列的索引。
not in 和not exists 如果查詢語句使用了not in 那麼內外表都進行全表掃描,沒有用到索引; 而not extsts 的子查詢依然能用到表上的索引。所以無論那個表大,用not exists 都比not in 要快。