mysql执行顺序、基本架构、索引

mysql语法顺序和执行顺序

  1. SELECT
  2. FROM
  3. LEFT JOIN
  4. ON
  5. WHERE
  6. GROUP BY
  7. HAVING
  8. ORDER BY
  9. LIMIT
  1. 执行顺序

  示例SQL:

  SELECT * FROM user LEFT JOIN order ON user.id = order.uid WHERE order.price > 1000 GROUP BY user.name HAVING count(1) > 5 ORDER BY user.name LIMIT 0,10

  1. FROM(将最近的两张表,进行笛卡尔积)---产生结果VT1
  2. ON(将VT1按照它的条件进行过滤)---产生结果VT2
  3. LEFT JOIN(保留左表的记录)---产生结果VT3
  4. WHERE(过滤VT3中的记录)--产生结果VT4到VTn
  5. GROUP BY(对VT4的记录进行分组)---产生结果VT5
  6. HAVING(对VT5中的记录进行过滤)---产生结果VT6
  7. SELECT(对VT6中的记录,选取指定的列)--产生结果VT7
  8. ORDER BY(对VT7的记录进行排序)--游标控制
  9. LIMIT(对排序之后的值进行分页)
  1. WHERE条件执行顺序(影响性能)
  1. MYSQL:从左往右去执行WHERE条件的。
  2. Oracle:从右往左去执行WHERE条件的。
  1. 结论:写WHERE条件的时候,优先级高的部分要去编写过滤力度最大的条件语句,这样后面的语句过滤前的结果会比较小,效率会比较高。

mysql逻辑架构

 

Connectors:指的是不同语言中与SQL的交互。

Management Serveices & Utilities:系统管理和控制工具

Connection Pool: 连接池

管理缓冲用户连接线程处理等需要缓存的需求。负责监听对 MySQL Server 的各种请求,接收连接请求,转发所有连接请求到线程管理模块。每一个连接上 MySQL Server 的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信,接受客户端的命令请求,传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建,线程的 cache 等。

SQL Interface: SQL接口

接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface

Parser: 解析器

SQL命令传递到解析器的时候会被解析器验证和解析。主要功能:a . 将SQL语句进行语义和语法的分析,分解成数据结构,然后按照不同的操作类型进行分类,然后做出针对性的转发到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。b.  如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的

Optimizer: 查询优化器

SQL语句在查询之前会使用查询优化器对查询进行优化

它使用的是“选取-投影-联接”策略进行查询,  用一个例子就可以理解: select uid,name from user where gender = 1;

1.这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行过滤

2.这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤

3.将这两个查询条件联接起来生成最终查询结果

Cache和Buffer: 查询缓存。

他的主要功能是将客户端提交给MySQL的 select请求的返回结果集 cache 到内存中,与该 query 的一个 hash 值 做一个对应。该 Query 所取数据的基表发生任何数据的变化之后, MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中, Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等

存储引擎接口:存储引擎是基于表的,而不是数据库

存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品中,基本上只有 MySQL 可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是 一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天 MySQL 可插拔存储引擎的特色。

     从图还可以看出,MySQL区别于其他数据库的最重要的特点就是其插件式的表存储引擎。MySQL插件式的存储引擎架构提供了一系列标准的管理和服务支持,这些标准与存储引擎本身无关,可能是每个数据库系统本身都必需的,如SQL分析器和优化器等,而存储引擎是底层物理结构的实现,每个存储引擎开发者都可以按照自己的意愿来进行开发。

MySQL执行流程图

存储引擎:show engines;

存储引擎是针对表的

MySQL 5.5之后,默认的存储引擎由MyISAM变为InnoDB

 

Innodb

Myisam

存储文件

.frm 表定义文件

.ibd 数据文件

.frm 表定义文件

.myd 数据文件

.myi 索引文件

表锁、行锁

表锁

事务

ACID

不支持

CRDU

读、写

读多

count

扫表

专门存储的地方

索引结构

B+ Tree

B+ Tree

 

 

 

MyISAM不支持事务,但是读快,可以根据实际情况对不同的表使用不同的存储引擎,如日志可以使用MyISAM,业务表使用InnoDB

MySQL文件分为日志文件和数据文件

日志文件包含错误日志、二进制日志、查询日志、慢查询日志和InnoDB引擎在线Redo日志、中继日志等。

二进制日志(bin-log):

默认是关闭的,需要通过配置:log-bin=mysql-bin进行开启。其中mysql-bin是binlog日志文件的basename,binlog日志文件的名称:mysql-bin-000001.log

* binlog记录了数据库所有的ddl语句和dml语句,但不包括select语句内容,语句以事件的形式保存,描述了数据的变更顺序,binlog还包括了每个更新语句的执行时间信息,binlog主要作用是用于恢复数据,因此binlog对于灾难恢复和备份恢复来说至关重要。

* 如果是DDL语句,则直接记录到binlog日志,而DML语句,必须通过事务提交才能记录到binlog日志中。

* binlog还用于实现mysql主从复制。

* binlog还用于数据恢复。

慢查询日志(slow query log):

* 默认是关闭的。需要通过设置:slow_query_log=ON进行开启。

* 记录执行时间超过long_query_time秒的所有查询,便于收集查询时间比较长的SQL语句

事务日志:

* 事务日志(InnoDB特有的日志)也叫redo日志。

* 文件名为"ib_logfile0"和“ib_logfile1”,默认存放在表空间所在目录。

* 还有一个日志文件叫undo 日志,默认存储在ib_data目录下。

中继日志:

* 是在主从复制环境中产生的日志。

* 主要作用是为了从机可以从中继日志中获取到主机同步过来的SQL语句,然后执行到从机中。

数据文件

查看MySQL数据文件:SHOW VARIABLES LIKE ‘%datadir%’;

  1. .frm文件:主要存放与表相关的数据信息,主要包括表结构的定义信息
  2. .ibd和.ibdata文件:用来存储InnoDB存储引擎表数据和索引信息
  3. .myd文件:主要用来存储使用MyISAM存储引擎的表数据信息
  4. .myi文件:主要用来存储使用MyISAM存储引擎的表数据文件中任何索引的数据树。

索引

MYISAM和InnoDB两种存储引擎都是支持b+tree索引

  1. 索引的分类

       * 单列索引:

                     * 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。

                     * 唯一索引:索引列中的值必须是唯一的,但是允许为空值,

                     * 主键索引:是一种特殊的唯一索引,不允许有空值

       * 组合索引

              * 在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,使用组合索引时遵循最左前缀集合

索引的存储结构

MYISAM的索引是存储指向数据的地址;InnoDB的数据是存储在主键索引下面,其他索引中存储的都是主键的地址。

B Tree和B+ Tree的特点与区别:

* 树的高度一般都是在2-4这个高度,树的高度直接影响IO读写的次数。

* 如果是三层树结构---支撑的数据可以达到20G,如果是四层树结构---支撑的数据可以达到几十T

*  B Tree和B+ Tree的最大区别在于非叶子节点是否存储数据的问题。B Tree是非叶子节点和叶子节点都会存储数据。而B+ Tree只有叶子节点才会存储数据,而且存储的数据都是在一行上,而且这些数据都是有指针指向的,也就是由顺序的。

非聚集索引(MYISAM):

* 叶子节点只会存储数据行的指针,简单来说数据和索引不在一起,就是非聚集索引。

 * 主键索引和辅助索引都会存储指针的值

聚集索引(InnoDB):

* 主键索引(聚集索引)的叶子节点会存储数据行,也就是说数据和索引是在一起,这就是聚集索引。

* 辅助索引只会存储主键值

* 如果没有没有主键,则使用唯一索引建立聚集索引;如果没有唯一索引,MySQL会按照一定规则创建聚集索引。

使用索引时的注意事项:

  1. 尽量创建组合索引(组合索引其实会默认按照最左前缀原则帮我们创建多组索引)组合索引(id,name,sex)
  2. 索引最左前缀原则
  3. 索引覆盖:要查询的列,也要使用索引覆盖住
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章