Mysql避免全表掃描的方法

近期在面試中被問到如何避免mysql語句掃全表,感覺自己這部分還是比較欠缺,網上找了些資料,特此記錄下來。

 

避免全表掃描的方法:


 1. 應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: 

 

select id from t where num is null

 

 NULL對於大多數數據庫都需要特殊處理,mysql也不例外,它需要更多的代碼,更多的檢查和特殊的索引邏輯,有些開發人員完全沒有意識到,創建表時NULL是默認值,但大多數時候應該使用NOT NULL,或者使用一個特殊的值,如0,-1作爲默認值。

 

不能用null作索引,任何包含null值的列都將不會被包含在索引中。即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列    就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高性能。 任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的。 

 

此例可以在num上設置默認值0,確保表中num列沒有null值,然後這樣查詢: 

select id from t where num=0

 

2. 應儘量避免在 where 子句中使用!=或<>操作符,否則將引擎放棄使用索引而進行全表掃描。 

 

MySQL只有對以下操作符才使用索引:<<==>>=BETWEENIN,以及某些時候的LIKE可以在LIKE操作中使用索引的情形是指另一個操作數不是以通配符(%或者_)開頭的情形。例如,“SELECT id FROM t WHERE col LIKE 'Mich%';”這個查詢將使用索引,但“SELECT
id FROM t WHERE col  LIKE '%ike';”這個查詢不會使用索引。

 

3. 應儘量避免在 where 子句中使用 or 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,如: 

select id from t where num=10 or num=20 

可以這樣查詢: 

select id from t where num=10 union all select id from t where num=20

4.in 和 not in 也要慎用,否則會導致全表掃描,如: 

select id from t where num in(1,2,3) 

對於連續的數值,能用 between 就不要用 in 了: 

select id from t where num between 1 and 3 

5.下面的查詢也將導致全表掃描: 

select id from t where name like '%abc%' 

或者

select id from t where name like '%abc'
 

若要提高效率,可以考慮全文檢索。 

而select id from t where name like 'abc%' 纔用到索引

 

 7. 如果在 where 子句中使用參數,也會導致全表掃描。因爲SQL只有在運行時纔會解析局部變量,但優化程序不能將訪問計劃的選擇推 遲到運行時;它必須在編譯時進行選擇。然而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作爲索引選擇的輸入項。如下面語句將進行全表掃描: 

select id from t where num=@num

可以改爲強制查詢使用索引: 

select id from t with(index(索引名)) where num=@num


 8.應儘量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。如: 

select id from t where num/2=100 

應改爲: 

select id from t where num=100*2 

9. 應儘量避免在where子句中對字段進行函數操作,這將導致引擎放棄使用索引而進行全表掃描。如: 

select id from t where substring(name,1,3)='abc'--name
select id from t where datediff(day,createdate,'2005-11-30')=0--‘2005-11-30’生成的id 應改爲: 
 
select id from t where name like 'abc%' 
select id from t where createdate>='2005-11-30' and createdate<'2005-12-1' 


10.不要在 where 子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將可能無法正確使用索引。 

 

11.在使用索引字段作爲條件時,如果該索引是複合索引,那麼必須使用到該索引中的第一個字段作爲條件時才能保證系統使用該索引,否則該索引將不會被使用,並且應儘可能的讓字段順序與索引順序相一致。 

 

12.不要寫一些沒有意義的查詢,如需要生成一個空表結構:

 select col1,col2 into #t from t where 1=0 

這類代碼不會返回任何結果集,但是會消耗系統資源的,應改成這樣: create table #t(...) 

 

13.很多時候用 exists 代替 in 是一個好的選擇: 

select num from a where num in(select num from b) 

用下面的語句替換: 

select num from a where exists(select 1 from b where num=a.num) 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章