索引的底层结构以及使用

文章目录

前言
索引是一种提高查询效率的数据结构（B树或者是哈希结构）索引是创建在数据库表中，是对数据库表中的一列或者多列值的进行排序的一个结果，好处就是提高查询效率。

索引的创建和删除

建表时创建索引

create table user (
name VARCHAR(20) ,
sex BOOLEAN ,
[UNIQUE][FULLTEXT][PRIMARY KEY]INDEX index_name(id)
);

给已存在的表创建索引

添加PRIMARY KEY（主键索引）
ALTER TABLE table_name ADD PRIMARY KEY ( column )
添加UNIQUE(唯一索引)
ALTER TABLE table_name ADD UNIQUE ( column )
添加INDEX(普通索引)
ALTER TABLE table_name ADD INDEX index_name ( column )
添加FULLTEXT(全文索引)
ALTER TABLE table_name ADD FULLTEXT ( column)
添加多列索引
ALTER TABLE table_name ADD INDEX index_name ( column1, column2, column3 )

删除索引

alter table table_name drop index_name
drop index 索引名 on 表名

索引的分类

索引	功能
普通索引	没有任何限制条件，可以给任何类型的字段创建普通索引
唯一性索引	使用 UNIQUE 修饰的字段，值不能够重复，主键索引就隶属于唯一性索引
主键索引	使用 Primary Key 修饰的字段会自动创建索引
单列索引	在一个字段上创建索引
多列索引	在表的多个字段上创建索引
全文索引	使用 FULLTEXT 参数可以设置全文索引，只支持 CAHR，VARCHAR和TEXT类型的字段上。常用于数据量较大的字符串类型上，可以提高查询速度；只有 MyISAM存储引擎支持

索引的底层结构（以InnoDB的索引结构为例）

b树（balance tree）和b+树应用在数据库索引，可以认为是m叉的多路平衡查找树，但是从理论上讲，二叉树查找速度和比较次数都是最小的，一个m阶的多路平衡树具有如下特征：

定义任意非叶子结点最多只有M个儿子，且M>2；
根结点的儿子数为[2, M]；
除根结点以外的非叶子结点的儿子数为[M/2, M]，向上取整；
非叶子结点的关键字个数=儿子数-1；
所有叶子结点位于同一层；
k个关键字把节点拆成k+1段，分别指向k+1个儿子，同时满足查找树的大小关系。
一、 B树
关键字分布在整颗树中
任何一个关键字出现且只出现在一个结点中
搜索有可能在非叶子结点结束
其搜索性能等价于在关键字全集内做一次二分查找
二、B+树
有n棵子树的非叶子结点中含有n个关键字（b树是n-1个），这些关键字不保存数据，只用来索引，所有数据都保存在叶子节点（b树是每个关键字都保存数据）。
所有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。
所有的非叶子结点可以看成是索引部分，结点中仅含其子树中的最大（或最小）关键字。
通常在b+树上有两个头指针，一个指向根结点，一个指向关键字最小的叶子结点。
同一个数字会在不同节点中重复出现，根节点的最大元素就是b+树的最大元素。

B树和B+树的区别

B+树的所有叶子节点连接到一条链表上，支持区间查找
B树的所有节点不仅要存关键字，还要存储和关键字对应的数据地址，B+树的非叶子节点只存储关键字，只有叶子节点存储关键字和数据地址。
B+树的层数较少，查找索引时I/O操作较少
B树关键字在整个树的每个节点都存在，谁离根节点近，谁搜索的速度就快
B+关键字都会出现在叶子节点上，非叶子节点只存关键字，意味着所有的记录都在叶子节点上存储，所有记录搜索的时间是平均的。

由于磁盘的读取也是按block块操作的（内存是按page页面操作的），
因此B-树的节点大小一般设置为和磁盘块大小一致，这样一个B-树节点，
就可以通过一次磁盘I/O把一个磁盘块的数据全部存储下来，所以当使用B-树存储索引的时候，磁盘I/O的操作次数是最少的（MySQL的读写效率，主要集中在磁盘I/O上）。

三、系统底层结构
系统分为用户空间、内核空间两部分。
用户空间通过操作系统来控制计算机硬件中的磁盘来读取数据，计算机硬件和操作系统之间数据传输是以块为单位的，操作系统和用户空间是以页来传输数据,块为页的倍数。

检查where条件字段有没有创建过索引，从磁盘上加载索引文件到内存上（这个过程会产生磁盘I/O,这个就是影响查询最关键的东西）
在内存中用索引文件的数据构造一棵二叉树

SQL 的查表操作

检查where条件字段有没有创建过索引，从磁盘上加载索引文件（以块为单位）到内存上（这个过程会产生磁盘I/O,这个就是影响查询最关键的东西）
在内存中用索引文件的数据构造一棵二叉树
先加载根节点到用户空间，用户空间判断下一个需要加载的节点，从内存中再加载进来。
直到找到叶子节点

索引的使用

我们通过一些例子来比使用索引的好处。这是后面例子中用的数据表。

Explain
explain显示了mysql如何使用索引来处理select语句以及连接表。可以帮助选择更好的索引和写出更优化的查询语句。
使用方法，在select语句前加上explain就可以了
关于explain 请参考我的另一篇博客：https://blog.csdn.net/Alyson_jm/article/details/83722001
没有索引查询

初始时，表里只有三条数据，上面row = 3,表示当前查询为全表查询。key = null,没有使用索引。
有索引查询

ID 为主键，当前查询用了主键查询，row =1，提高了效率。

给经常作为where过滤条件的字段和分组排序字段创建联合索引

根据联合索引的第一个字段进行过滤得到一个结果集
结果集已经拍好了序，直接从内存中拿出来，减少了外部排序

下面这个语句中，class_name 没有创建索引，并且我们按照score排序，rows = 6,它使用了全表遍历，并且使用了外部排序，这非常的耗费资源。

按照class_stu进行全表查询，得到一个结果集
对结果集进行外部排序

创建联合索引
根据索引树得到一个结果集
得到的这个结果集已经按照score排好了序。

要使用联合索引，一定要先使用联合索引的第一个字段
虽然score建立了索引，但是它是索引的第二个字段，索引树是按照联合索引的第一个字段建立的，所以SQL选择了全表查询。

内连接查询 查询过程
Mysql先比较哪个表小，从小表里找到所有的记录
去大表里取数据进行比较。
大表决定了查询的次数，小表决定了每次循环的查询时间。
在这个例子中就是先对class_stu 进行全表查询，然后根据class_stu的值去student里一个一个匹配（因为大表student没有加索引）

所以内连接查询在大表里加索引，加快了匹配的效率。
给大表增加索引

加了索引之后大表student 就不是全表查询了，加快了查询效率。
- 大表小表也不是绝对的。如果大表有过滤条件，那就判断哪个开销小哪个就是小表，如果大表的过滤条件有加索引，并且过滤掉后的数据比小表还少，那么此时大表就变成了小表。
- 当大表student有过滤条件时，SQL判断student过滤后只有一条数据，就将student作为小表，大表就变成了class_stu.根据student的数据对calss_stu一行一行匹配。
- 给class_stu的stu_name加索引，此时calss_stu 的rows = 3,比原来的rows = 8 来说效率提高了一点。
  
  3.左连接查询
  左连接查询是把左边的数据全部拿出来，去和右边进行匹配，给右表加索引会增加查询效率。
  右表没加索引
  
  给表图加上索引
  
  4.右连接查询
  右连接查询和左连接查询刚好相反，右边的数据被全部拿出，去和左边的表进行匹配，给左表加索引会增加查询效率。

索引的设计要求

给经常作为where过滤条件的字段和分组排序字段创建联合索引。
要使用联合索引，一定要先使用联合索引的第一个字段。
一般给区分度高的字段创建索引。
尤其是对于字符串类型的字段，创建索引的时候可以指定索引的长度，只用字符串的一部分来创建索引数据就可以啦。
索引的数目不宜过多
使用数据量少的索引（如前缀索引,主要针对字符串类型,字符串类型,尽量创建前缀索引）
对于多列索引，优先指定最左边的列集.

使用索引的注意事项

无法使用索引的情况


like “%XXX%”	not in	<>	or

1、 like通配符放到前面是没有索引的
当通配符在最前面表示前面任意什么字符都可以，根据索引树的结构来说，SQL不知道怎么判断，所以就放弃使用索引。

2、使用not in 无法用到索引

找不在某个集合里面的元素还是要遍历B树里所有的元素，直接全表查询更方便。
3、使用！= 无法用到索引,同理<>也无法用到索引

4、使用or无法用到索引
通过or连接有多个查询条件，一次查询只能用一个索引，即使SQL使用了某个索引，也不可避免的要再进行一次全表查询，降低了效率，所以SQL放弃了使用索引。

索引不宜过多
索引的数据结构是B树，在查询时会增加效率，但是在插入和更新数据的时候会降低效率，得不偿失。

只select需要用到的字段，尽量不要用到
B+树存储的是索引的关键字，除了关键字还有主键值，通过主键值去主键索引树（主键索引树里每个数据项不仅存储主键值，还存储主键对应的行的记录），里面查找需要的记录。
用*查询会先按照索引关键字找到对应的主键值，然后通过主键值进行主键索引，产生了二次索引。
需要查询部分值的时候，可以建立联合索引，将过滤条件用作联合索引的第一个字段。

索引的长度最好限制一下
索引的长度如果太长，每一个节点里存储的索引数就比较少，增加了查找的次数。

索引的底层结构以及使用

文章目录

索引的创建和删除

索引的分类

索引的底层结构（以InnoDB的索引结构为例）

SQL 的查表操作

索引的使用

索引的设计要求

使用索引的注意事项

索引的底層結構以及使用

MYSQL的注入式錯誤

explain關鍵字

Mybatis學習（四）——Association 查詢和Collection 查詢

Mybatis 學習（三）——動態SQL

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結