索引
索引(Index)是帮助MySQL高效获取数据的数据结构。可以得到索引的本质:索引是数据结构
右侧是数据表,一共有两列七条记录,最左边的是数据记录的物理地址
索引分类
普通索引
:即一个索引只包含单个列,一个表可以有多个单列索引唯一索引
:索引列的值必须唯一,但允许有空值复合索引
:即一个索引包含多个列聚簇索引(聚集索引)
:并不是一种单独的索引类型,而是一种数据存储方式。具体细节取决于不同的实现,InnoDB的聚簇索引其实就是在同一个结构中保存了B-Tree索引(技术上来说是B+Tree)和数据行。非聚簇索引
:不是聚簇索引,就是非聚簇索 show global variables like “%datadir%”;
语法
- 查看索引
SHOW INDEX FROM table_name
- 创建索引
CREATE [UNIQUE ] INDEX indexName ON mytable(columnname(length));
ALTER TABLE 表名 ADD [UNIQUE ] INDEX [indexName] ON (columnname(length))
- 删除索引
DROP INDEX [indexName] ON mytable;
执行计划
使用EXPLAIN
关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
执行计划的作用
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
执行计划包含的信息
执行计划-ID
select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序,id值越大优先级越高,越先被执行
执行计划-select_type
查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询
执行计划-table
显示这一行的数据是关于哪张表的
执行计划-type
type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:system
>const
>eq_ref
>ref
>range
>index
>ALL
system
表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计const
表示通过索引一次就找到了
const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快,如将主键置于where列表中,MySQL就能将该查询转换为一个常量eq_ref
唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫ref
非唯一性索引扫描,返回匹配某个单独值的所有行range
只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引
一般就是在你的where语句中出现了between
、<
、>
、in
等的查询index
全表扫描的一种,但只扫描索引文件all
Full Table Scan,将遍历全表以找到匹配的行
执行计划-possible_keys
可能会使用到的索引
执行计划-key
实际使用的索引。如果为NULL,则没有使用索引
查询中若使用了覆盖索引,则该索引和查询的select字段重叠
执行计划-key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好
key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。根据这个值,就可以判断索引使用情况,特别是在组合索引的时候,判断所有的索引字段是否都被查询用到。
datetime类型在5.6中字段长度是5个字节
变长字段需要额外的2个字节(VARCHAR值保存时只保存需要的字符数,另加一个字节来记录长度(如果列声明的长度超过255,则使用两个字节),所以VARCAHR索引长度计算时候要加2),固定长度字段不需要额外的字节。
而NULL都需要1个字节的额外空间,所以索引字段最好不要为NULL,因为NULL让统计更加复杂并且需要额外的存储空间。
复合索引有最左前缀的特性,如果复合索引能全部使用上,则是复合索引字段的索引长度之和,这也可以用来判定复合索引是否部分使用,还是全部使用
执行计划-ref
显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
执行计划-rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
执行计划-Extra
覆盖索引(Covering Index),一说为索引覆盖。
- 理解方式一:就是select的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
- 理解方式二:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据;当能通过读取索引就可以得到想要的数据,那就不需要读取行了。一个索引包含了(或覆盖了)满足查询结果的数据就叫做覆盖索引
如果要使用覆盖索引,一定要注意select列表中只取出需要的列,不可select *