工作中的点点滴滴-MySql的索引失效问题

原創

2021-04-27 13:19

　　最近的工作内容比较枯燥，就是根据运营小姐姐的需求，给她出一些不同维度的数据报表，那么提到报表，多多少少是离不开数据库写sql的，然后就是各种Left Join 呀，Inner Join 呀，子查询呀。然后在这个过程中，避免不了条件过滤的情况，当数据表的数据量大了起来，那执行一个sql可真的是要了我的老命了。所以这个时候你就要想着怎么去优化这个sql语句了，所以创建添加索引就标的必不可少了。

　　首先在创建索引的前提是，你应该在哪些字段上去创建索引呢？那说到这里，肯定是需要针对一些需要条件查询的字段去创建索引呀，其实这句话只说对了一半吧。我们在建立索引的时候，首先要pass掉那种频繁修改的字段，因为你在给字段创建索引的时候，其实本质上是在B+树上创建了一个子叶节点，在你更新索引字段的时候，B+树会重建索引，这个过程是非常慢的，并且会伴随着锁表的情况。其次就是区分度不大的那种字段，比如性别这类，因为这种类型的字段建索引意义不大，性能基本上和全表扫描的性能差不多，另外就是mysql的优化器有个默认配置，就是返回数据的比例在30%以外的情况，是不会选择使用索引的，这个30%是一个大概的范围，并不是固定死的。还有一种比较特数据的，就是会有null的这种字段也不合适做索引，虽然说索引是支持null的，但是从规范上讲，null是一种没有意义的对象，可以设置一个默认值来解决这种问题。索引建立好了，并不是放在where后面跟上查询条件就可以使用了，毕竟自己也踩过坑了，要不然也不会有这个笔记的诞生了。

　　业务表结构和索引展示如下：

　　　　　　　　　　　

　　这张数据操作表的原始数据了大概是730w左右，通过数据id来查询的sql的执行计划查看如下：

　

来，我们分析一下这个执行计划先，要看懂执行计划，首先我们要搞懂这每一列的含义。

　　select_type:查询类型主要有三种，第一种SIMPLE简单查询，这种是最优的查询语句。第二种是PRIMARY子查询，一般是最外层会被标记为PRIMARY。第三种就是联合查询UNION了，一般像Left Join，Inner Join这类查询的。table:查询涉及到的表或者别名。partitions：分区信息，一般为null。type：这一列是我们需要重点照看的字段了，这列是访问类型，也是优化的重点对象，一般这列的结果值从好到不好依次是：system(系统表，少量数据，往往不需要进行磁盘IO)> const (常量连接)> eq_ref (主键索引（primary key）或者非空唯一索引（unique not null）等值扫描)> ref (非主键非唯一索引等值扫描)> range(范围扫描) > index(索引树扫描) > ALL(全表扫描（full table scan）)，所以我们常说的sql优化最先就是按照这个指标来优化的。possible_keys：查询可能会用到的索引，这个字段和后面的key有点儿类似。key：执行计划实际上使用到的索引，没有的话就是null。rows：查询结果大致估算出找到所需的记录所需要读取的行数，这个值是越小越好。filtered：和rows类型，所需要查询到的结果行占用读取行的百分比，这个值越大越好。Extra：这列比较特殊，再用到特殊的查询会体现出来，经常用到的有这些值，可以在优化sql的时候考虑进去，using temporary,使用临时表保存中间结果，比如在orderBy或者groupBy的时候。using index,查询语句中使用了覆盖索引-Covering Index时候，效率会比较好，避免访问了数据行。using where使用了where条件的时候。using index condition：虽然命中了索引，但不是所有列都在索引树上需要访问实际的记录行。using join buffer：采用关联查询或者子查询的时候需要进行嵌套循环计算。

　　现在我们明白了执行计划了，那么看索引有没有生效，这样就会方便很多了。一：最典型的也是我们经常使用到的不等于<>，type列是All，等于是走了全表扫描。

二：列和列相等去做条件查询，比如operate_date_id = operate_user_id，可以看到这种查询也是全表扫描的。

　

三：通过where in 条件查询，这种查询条件也比较特殊，比如operate_date_id是int类型，然后operate_date_id in ('111')这种是不会走索引的，但是operate_date_id in (111) 却是会走索引的，另外如果where in（）的条件多了，也是不会走索引的，所以在使用where in的时候，一定要注意。并且像 not，not in,not exists也都是属于这类似的情况。

四：like通配符来模糊查询，这种查询也是比较坑，稍不留神就掉坑里了，看下面两个执行计划。当使用模糊搜索时，尽量采用后置的通配符，后匹配可以走INDEX RANGE SCAN。

另外其他的经常我们会在where条件用upper(operate_user_name)='小旭旭宝宝A'，这种函数表达式，这样也是会导致索引失效。还有一种比较特殊的大于小于号和between，通过执行计划你可以发现其实这两种条件的执行计划是一抹一样的。但是呢如果你的mysql版本是>=5.6，在information_schema中的optimizer_trace表，可以跟踪到执行计划的具体步骤，通知cost_for_plan执行计划代价指标来判断，返现大于小于这种情况的代价值往往会比between小（个人感觉不会是绝对的，虽然通过上面的业务表测试了几个类型的字段结果都是一致的，但是官方文档并没有明文支出这两种方法的差异），类似于这种大于小于比较符号，通常优化器，会更具实际查询数据量的比例来判断，如果全表扫描比索引快，则不会走索引。

　　那么说了索引失效的情况，那具体说为什么索引会失效呢？首先先确认一点就是mysql的索引是以B+树来存储的，那为什么选择B+树，而不是哈希索引或者B树，二叉树呢？对于哈希来说他是无序的，不能进行范围搜索。B树相对于二叉树，虽然可以解决一部分的查找效率，但是都会有回旋查找的问题，而B+树因为他的非叶子节点可以存储key，叶子节点既能存储key也能存储value，并且叶子节点还是有序的，节点之间用指针连接也避免了回旋问题了。如果理解了索引的存储方式后，其实索引查询就和在B+树查询原理是一样的，如果要命中索引，那么首先要确定查询字段的值，也就是查询字段是在哪些节点上，然后在节点上在通过顺序查询或者二分查询具体的节点就可以命中索引，反之则会无法命中索引导致索引失效。

　　

　　　　　　　　　　

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

10分钟搞定Mysql主从部署配置

流程 Master數據庫安裝 Slave數據庫安裝配置Master數據庫配置Slave數據庫網絡信息 Master數據庫IP：192.168.198.133 Slave數據庫IP：192.168.198.132 配置Maste

2024-05-17 14:31:12

无法AC，关于使用fgets碰到的问题——末尾多一个换行符

題目是輸入一串字符串，包含空格，裏面有多個單詞，將每個單詞翻轉輸出，並且單詞之間的空格要與原文一致。寫的時候沒有使用string的輸入，而是選擇了char數組的輸入。樣例測試hello world->olleh dlrow是沒有問題的，

2024-05-17 14:30:52

lightdb秒级增加列和删除列（not null带默认值）

　　對數據量過億的大表而言，dba最頭疼的是隨着業務變化增加帶默認值的字段，以及修改字段的數據類型，在實現不好的數據庫中，動不動執行半天，中途失敗的話，還會卡半天。這在lightdb中是不會發生的。如下所示： lightdb@oradb=

2024-05-17 14:28:42

lightdb mysql 8.0兼容之不可见主键

　　數據庫設計通常需要滿足一定的範式要求，其中主鍵更是最基本的要求。不過，數據庫管理系統卻允許我們創建沒有主鍵的表。這樣的表在數據庫中會帶來查詢性能低下、複製延遲甚至無法實現高可用配置等問題。　　爲此，lightdb在22.1版本引入了一

2024-05-17 14:28:42

lightdb数据库超时相关控制参数

　　在業務開發中，通常因爲代碼不規範、中間件缺陷、DBA誤提交批量SQL等原因，會導致服務端連接一直存在、但是實際上並未在執行的情況，從而導致數據庫連接泄露。爲了防止這種異常情況積壓，lightdb中包含了多個參數用於控制超時相關的行爲：

2024-05-17 14:28:42

如何使用 JS 判断用户是否处于活跃状态

有時候，我們需要在網頁判斷用戶是否處與非活躍狀態，如果用戶長時間沒有在頁面上進行任何操作，我們則判定該用戶是非活躍的。在 javascript 中我們可以通過監聽某些鼠標或鍵盤相關的事件來判定用戶是否在活躍中。案例演示在線演示 - 使

2024-05-17 14:26:51

使用 JS 实现在浏览器控制台打印图片 console.image()

在前端開發過程中，調試的時候，我門會使用 console.log 等方式查看數據。但對於圖片來說，僅靠展示的數據與結構，是無法想象出圖片最終呈現的樣子的。雖然我們可以把圖片數據通過 img 標籤展示到頁面上，或將圖片下載下來進行預覽。但這

2024-05-17 14:26:51

基于Ubuntu-22.04安装K8s-v1.28.2实验（四）使用域名访问网站应用

安裝負載均衡metalb 安裝metalb kubectl create namespace metallb-system 配置metalb #kubectl create secret generic -n metallb-system

2024-05-17 14:25:27

Flink的State

有狀態的計算是流式計算框架的一個重要功能，很多複雜的計算場景都需要記錄一下相關的狀態。Flink State一種爲了滿足算子計算時需要歷史數據需求的，使用 checkpoint 機制進行容錯，存儲在 state backend 的數

人不瘋狂枉一生

2024-05-17 14:23:00

ASP.NET Core Web中使用AutoMapper进行对象映射

前言在日常開發中，我們常常需要將一個對象映射到另一個對象，這個過程中可能需要編寫大量的重複性代碼，如果每次都手動編寫，不僅會影響開發效率，而且當項目越來越複雜、龐大的時候還容易出現錯誤。爲了解決這個問題，對象映射庫就隨之而出了，這些庫可以

2024-05-17 14:22:00

第四节：MySQL主从集群搭建、扩容与数据迁移、半同步复制详解

一. 二. 三. ! 作者 : Yaopengfei(姚鵬飛) 博客地址 : http://www.cnblogs.com

2024-05-17 14:21:40

RDLC降低使用内存

在Winform使用RDLC時，在批量打印情況下，內存隨着打印任務的數量逐漸增加。即便手動GC效果也不明顯。原因： localReport在創建時，每個實例都是一個應用程序域。租約的過期時間比較久，按照網上的資料，過期時間大約10分鐘左右

煙臺西炮臺

2024-05-17 14:21:20

❤️‍🔥 Solon Cloud Event 新的事务特性与应用

1、Solon Cloud Event？是 Solon 分佈式事件總線的解決方案。也是 Solon “最終一致性”分佈式事務的解決方案之一 2、事務特性事務？就是要求 Event 有原子性，當多個 Event 發佈時，要麼全成功，要麼

2024-05-17 14:21:09

AI-FastGPT安装

最近開始體驗FastGPT知識庫問答系統，參考官方文檔，在自己的阿里雲服務器使用Docker Compose快速完成了部署。環境說明：阿里雲ECS，2核8G，X86架構，CentOS 7.9操作系統。 Docker與Docker-Com

2024-05-17 14:14:58

matlab练习程序（线性常微分方程组矩阵解）

之前有通過ode和simulink解線性常微分方程組。除了上面兩種方法，線性常微分方程組還可以通過矩陣的方法求解。比如下面這個之前使用的方程組： x'' = x' - x + y' -z' y'' = y' - y - x' z'' =

2024-05-17 14:11:07

24小時熱門文章

最新文章

最新評論文章