Mysql避免全表扫描的方法

近期在面试中被问到如何避免mysql语句扫全表,感觉自己这部分还是比较欠缺,网上找了些资料,特此记录下来。

 

避免全表扫描的方法:


 1. 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: 

 

select id from t where num is null

 

 NULL对于大多数数据库都需要特殊处理,mysql也不例外,它需要更多的代码,更多的检查和特殊的索引逻辑,有些开发人员完全没有意识到,创建表时NULL是默认值,但大多数时候应该使用NOT NULL,或者使用一个特殊的值,如0,-1作为默认值。

 

不能用null作索引,任何包含null值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只要这些列中有一列含有null,该列    就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也不会提高性能。 任何在where子句中使用is null或is not null的语句优化器是不允许使用索引的。 

 

此例可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: 

select id from t where num=0

 

2. 应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。 

 

MySQL只有对以下操作符才使用索引:<<==>>=BETWEENIN,以及某些时候的LIKE可以在LIKE操作中使用索引的情形是指另一个操作数不是以通配符(%或者_)开头的情形。例如,“SELECT id FROM t WHERE col LIKE 'Mich%';”这个查询将使用索引,但“SELECT
id FROM t WHERE col  LIKE '%ike';”这个查询不会使用索引。

 

3. 应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如: 

select id from t where num=10 or num=20 

可以这样查询: 

select id from t where num=10 union all select id from t where num=20

4.in 和 not in 也要慎用,否则会导致全表扫描,如: 

select id from t where num in(1,2,3) 

对于连续的数值,能用 between 就不要用 in 了: 

select id from t where num between 1 and 3 

5.下面的查询也将导致全表扫描: 

select id from t where name like '%abc%' 

或者

select id from t where name like '%abc'
 

若要提高效率,可以考虑全文检索。 

而select id from t where name like 'abc%' 才用到索引

 

 7. 如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推 迟到运行时;它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描: 

select id from t where num=@num

可以改为强制查询使用索引: 

select id from t with(index(索引名)) where num=@num


 8.应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如: 

select id from t where num/2=100 

应改为: 

select id from t where num=100*2 

9. 应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如: 

select id from t where substring(name,1,3)='abc'--name
select id from t where datediff(day,createdate,'2005-11-30')=0--‘2005-11-30’生成的id 应改为: 
 
select id from t where name like 'abc%' 
select id from t where createdate>='2005-11-30' and createdate<'2005-12-1' 


10.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。 

 

11.在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。 

 

12.不要写一些没有意义的查询,如需要生成一个空表结构:

 select col1,col2 into #t from t where 1=0 

这类代码不会返回任何结果集,但是会消耗系统资源的,应改成这样: create table #t(...) 

 

13.很多时候用 exists 代替 in 是一个好的选择: 

select num from a where num in(select num from b) 

用下面的语句替换: 

select num from a where exists(select 1 from b where num=a.num) 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章