数据库 = MySQL 索引以及原理

mysql索引:创建索引,创建索引原则,索引的数据结构,mysql数据存储引擎

mysql性能

一.MySQL性能

(1)数据库性能优化分为两种:硬优化,软优化

分析--执行次数比较多的的语句:

=查询密集型:我们使用查询频率较高,8:2左右

我们就可以使用索引来进行优化

=修改密集型

ES

--查询累计插入 和 返回数据条数

show global status like 'Innodb_rows%';

(2)查看-sql语句的执行效率

插入千万条记录:

CREATE DATABASE crmproject;

USE crmproject;

-- 1. 准备表
CREATE TABLE `user`(
	id INT,
	username VARCHAR(32),
	`password` VARCHAR(32),
	sex VARCHAR(6),
	email VARCHAR(50)
);

-- 2. 创建存储过程,实现批量插入记录
DELIMITER $$ -- 声明存储过程的结束符号为$$
CREATE PROCEDURE auto_insert()
BEGIN
    DECLARE i INT DEFAULT 1;
	START TRANSACTION; -- 开启事务
    WHILE(i<=10000000)DO
        INSERT INTO `user` VALUES(i,CONCAT('ack',i),MD5(i),'male',CONCAT('ack',i,'wld.cn'));
        SET i=i+1;
    END WHILE;
	COMMIT; -- 提交
END$$ -- 声明结束
DELIMITER ; -- 重新声明分号为结束符号

-- 3. 查看存储过程
SHOW CREATE PROCEDURE auto_insert;

-- 4. 调用存储过程
CALL auto_insert();

耗时非常大如下:

慢查询日志:

-- 查看慢查询日志开启情况
show variables like '%slow_query_log%';

-- 查看慢查询时间配置
show variables like '%long_query_time%';

查询当前的慢日志状态
show variables like '%query%' ;
 
其中long_query_time表示执行时间比较长的记录 slow_query_log=off 表示慢日志为关闭状态,slow_query_log_file 表示慢日志存储的位置

开启慢查询日志

set global slow_query_log = on;

设置慢查询sql的时间阈值

-- 全局配置(下次生效...)
set global long_query_time=3;
-- 临时(会话)配置(本次会话窗口生效)
set session long_query_time=3;

测试慢查询日志:

慢查询日志文件分析:

二,MySQL索引

(1)什么是索引:将数据进行排序整理的过程就称为 索引

我们根据索引去查,提高效率

MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。
 
(2)MySQL索引的分类

* 主键(约束)索引
        主键约束+提高查询效率:加速查询 + 列值唯一(不可以有null+ 表中只有一个 , 主键约束
        
* 唯一(约束)索引
        唯一约束+提高查询效率:加速查询 + 列值唯一(可以有null) 唯一约束

* 普通索引
        仅提高查询效率

* 组合(联合)索引
        多个字段组成索引:多列值组成一个索引,注意:最左匹配原则

* 全文索引
        solr、es

* hash索引
        根据key-value 效率非常高)

(3)MySQL索引语法

创建索引:

  • 直接创建:

-- 创建普通索引
create index 索引名 on 表名(字段);

-- 创建唯一索引
create unique index 索引名 on 表名(字段);

-- 创建普通组合索引
create index 索引名 on 表名(字段1,字段2);

-- 创建唯一组合索引
create unique index 索引名 on 表名(字段1,字段2);

-- 创建学生表
CREATE TABLE student(
 id INT,
 `name` VARCHAR(32),
 telephone VARCHAR(11)
);

-- name字段适合设置什么索引?
CREATE INDEX name_idx ON student(`name`);

-- telephone适合设置什么索引?
CREATE UNIQUE INDEX telephone_uni_idx ON student(telephone);
  • 修改表时创建

-- 添加一个主键,这意味着索引值必须是唯一的,且不能为NULL
alter table 表名 add primary key(字段);  --默认索引名:primary

-- 添加唯一索引(除了NULL外,NULL可能会出现多次)
alter table 表名 add unique(字段); -- 默认索引名:字段名

-- 添加普通索引,索引值可以出现多次。
alter table 表名 add index(字段); -- 默认索引名:字段名

-- 指定id为主键索引
ALTER TABLE student ADD PRIMARY KEY(id);
-- 指定name为普通索引
ALTER TABLE student ADD INDEX(`name`);
-- 指定telephone为唯一索引
ALTER TABLE student ADD UNIQUE(telephone);
  • 创建表时创建
-- 创建教师表
CREATE TABLE teacher(
 id INT PRIMARY KEY AUTO_INCREMENT, -- 主键索引
 `name` VARCHAR(32),
 telephone VARCHAR(11) UNIQUE, -- 唯一索引
 sex VARCHAR(5),
 birthday DATE,
 INDEX(`name`) -- 普通索引
);

删除索引:

-- 直接删除
drop index 索引名 on 表名;

-- 修改表时删除
alter table 表名 drop index 索引名;

-- 删除name普通索引
DROP INDEX name_idx ON student;

-- 删除telephone唯一索引
ALTER TABLE student DROP INDEX telephone_uni_idx;

(4)千万级表记录效果演示:

测试没有索引的情况下查询

-- 1.指定id查询
select * from user where id = 8888888;
-- 2.指定username精准查询
select * from user  where username = 'jack1234567';
-- 3.指定email模糊查询
select * from user  where email like 'jack1234567%';

给这三个字段添加索引:

-- 指定id为主键索引
ALTER TABLE USER ADD PRIMARY KEY(id);
-- 指定username为普通索引
ALTER TABLE USER ADD INDEX(username);
-- 指定email为唯一索引
ALTER TABLE USER ADD UNIQUE(email);

在有索引的情况下查询:

-- 1.指定id查询
select * from user where id = 8888888;
-- 2.指定username精准查询
select * from user  where username = 'jack1234567';
-- 3.指定email模糊查询
select * from user  where email like 'jack1234567%';

(5)索引的优缺点:

优势:

① 类似大学图书馆建书目索引,提高数据检索的效率,降低数据库的 IO 成本。 ② 通过索引列对数据
进行排序,降低数据排序的成本,降低 CPU 的消耗。
 

劣势:

① 实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用
空间的
② 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERTUPDATE
DELETE操作 , MySQL不仅要保存数据,还要更新一下索引文件 , 理论上来说 , 频繁的更新索引字段的数
, 表的更新效率会下降
 
总结:
优点:减少磁盘IO,提高查询效率
缺点:索引占用磁盘空间
        我们在进行增删改时,索引的维护会增加成本,可能会降低服务器性能

 

(6)索引创建的原则

1. 字段内容可识别度不能低于70%

2. 经常使用where条件搜索的字段

3. 经常使用表连接的字段(内连接、外连接)

4. 经常排序的字段 order by


* 注意:索引本身会占用磁盘空间,不是所有的字段都适合增加索引....

(7)常见索引失效情况

-- 1.使用like模糊匹配,%通配符在最左侧使用时
select * from user where email like '%jack1234567%';
-- 2.尽量避免使用or,如果条件有一个没有索引,那么会进行全表扫描
select * from user where id = 88 or sex = 'male';
-- 3.在索引列上进行计算
select * from user where  id+1 = 88;
-- 4.使用 !=、 not in、is not null时
select * from user where username != 'jack12';

(8)索引的数据结构

索引是帮助MySQL高效获取排好序的数据结构

为啥使用索引后查询效率提高了很多呢?

在没有索引的情况下我们执行一条sql语句,那么是表进行全局遍历,磁盘寻址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。

select  * from user where col1=6;

为了加快的查找效率,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速获取到相应数据。

select  * from user where col2=89;

索引的数据结构:

  • 二叉树:左边的子节点比父节点小,右边的子节点比父节点大

  • 红黑树:平衡二叉树(左旋、右旋)

1000w条记录,使用红黑树,数的深(高)度

  • BTree:多路平衡搜索树

  • B+Tree:优化BTree(非叶子节点:索引+指针、叶子节点:索引+数据【地址】)

  • Hash,通过散列算法,不支持范围查询

 

MySQL中的B+Tree

-- 查看mysql索引节点大小
show global status like 'innodb_page_size';

MySQL中的B+Tree索引结构示意图

 

(9)索引的存储引擎

MySQL存储引擎的不同,那么索引文件保存的方式也有所不同,常见的有二种存储引擎MyISAMInnoDB

  • myisam(非聚集索引)

MySQL5.5版本之前默认存储引擎 :特点:不支持事务、不支持外键约束

CREATE DATABASE crmpro;
USE crmpro;

-- 创建 myisam存储引擎表
CREATE TABLE tab_myisam(
 id INT,
 `name` VARCHAR(32)
)ENGINE=MYISAM;

  • InnoDB(聚集索引)

MySQL5.5版本之后默认存储引擎 :特点:支持事务、支持外键约束

-- 创建 innodb存储引擎表
CREATE TABLE tab_innodb(
 id INT,
 `name` VARCHAR(32)
)ENGINE = INNODB;

innodb存储引擎必须要设置主键(整型),且自增类型....

 

资料:

算法演示网站

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章