MySql中Explain詳解與索引最佳實踐

.使用EXPLAIN關鍵字可以模擬優化器執行SQL語句,從而知道MySQL是 如何處理你的SQL語句的。分析你的查詢語句或是結構的性能瓶頸  
下面是使用 explain 的例子: 
在 select 語句之前增加 explain 關鍵字,MySQL 會在查詢上設置一個標記,執行查詢時,會返回執行計劃的信息,而不是執行這條SQL(如果 from 中包含子查詢,仍會執行該子查詢,將結果放入臨時表中)
使用的表
DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
  `id` int(11) NOT NULL,
  `name` varchar(45) DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2017-12-22 15:27:18'), (2,'b','2017-12-22 15:27:18'), (3,'c','2017-12-22 15:27:18');

DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');

DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
  `id` int(11) NOT NULL,
  `film_id` int(11) NOT NULL,
  `actor_id` int(11) NOT NULL,
  `remark` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1); 
mysql> explain select * from actor; 

 

在查詢中的每個表會輸出一行,如果有兩個表通過 join 連接查詢,那麼會輸出兩行。表的意義相當廣泛:可以是子查詢、一個 union 結果等。
explain 有兩個變種:
1)explain extended:會在 explain  的基礎上額外提供一些查詢優化的信息。緊隨其後通過 show warnings 命令可以 得到優化後的查詢語句,從而看出優化器優化了什麼。額外還有 filtered 列,是一個半分比的值,rows * filtered/100 可以估算出將要和 explain 中前一個表進行連接的行數(前一個表指 explain 中的id值比當前表id值小的表)。
mysql> explain extended select * from film where id = 1;
 
mysql> show warnings; 
 
2)explain partitions:相比 explain 多了個 partitions 字段,如果查詢是基於分區表的話,會顯示查詢將訪問的分區。

explain 中的列
接下來我們將展示 explain 中每個列的信息。
1. id列
id列的編號是 select 的序列號,有幾個 select 就有幾個id,並且id的順序是按 select 出現的順序增長的。MySQL將 select 查詢分爲簡單查詢(SIMPLE)和複雜查詢(PRIMARY)。
複雜查詢分爲三類:簡單子查詢、派生表(from語句中的子查詢)、union 查詢。
id列越大執行優先級越高,id相同則從上往下執行,id爲NULL最後執行
1)簡單子查詢
mysql> explain select (select 1 from actor limit 1) from film;
 

2)from子句中的子查詢
mysql> explain select id from (select id from film) as der; 
 
這個查詢執行時有個臨時表別名爲der,外部 select 查詢引用了這個臨時表

3)union查詢
mysql> explain select 1 union all select 1;
 
union結果總是放在一個匿名臨時表中,臨時表不在SQL中出現,因此它的id是NULL。

2. select_type列
select_type 表示對應行是簡單還是複雜的查詢,如果是複雜的查詢,又是上述三種複雜查詢中的哪一種。
1)simple:簡單查詢。查詢不包含子查詢和union
mysql> explain select * from film where id = 2;
 
2)primary:複雜查詢中最外層的 select
3)subquery:包含在 select 中的子查詢(不在 from 子句中)
4)derived:包含在 from 子句中的子查詢。MySQL會將結果存放在一個臨時表中,也稱爲派生表(derived的英文含義)
用這個例子來了解 primary、subquery 和 derived 類型
mysql> explain select (select 1 from actor where id = 1) from (select * from film where id = 1) der;
 
5)union:在 union 中的第二個和隨後的 select
6)union result:從 union 臨時表檢索結果的 select
用這個例子來了解 union 和 union result 類型:
mysql> explain select 1 union all select 1;
 

3. table列
這一列表示 explain 的一行正在訪問哪個表。
當 from 子句中有子查詢時,table列是 <derivenN> 格式,表示當前查詢依賴 id=N 的查詢,於是先執行 id=N 的查詢。
當有 union 時,UNION RESULT 的 table 列的值爲<union1,2>,1和2表示參與 union 的 select 行id。

4. type列
這一列表示關聯類型或訪問類型,即MySQL決定如何查找表中的行,查找數據行記錄的大概範圍。
依次從最優到最差分別爲:system > const > eq_ref > ref > range > index > ALL
一般來說,得保證查詢達到range級別,最好達到ref
NULL:mysql能夠在優化階段分解查詢語句,在執行階段用不着再訪問表或索引。例如:在索引列中選取最小值,可以單獨查找索引來完成,不需要在執行時訪問表
mysql> explain select min(id) from film; 
 

const, system:mysql能對查詢的某部分進行優化並將其轉化成一個常量(可以看show warnings 的結果)。用於 primary key 或 unique key 的所有列與常數比較時,所以表最多有一個匹配行,讀取1次,速度比較快。system是const的特例,表裏只有一條元組匹配時爲system
mysql> explain extended select * from (select * from film where id = 1) tmp;
 
mysql> show warnings; 
 

eq_ref:primary key 或 unique key 索引的所有部分被連接使用 ,最多隻會返回一條符合條件的記錄。這可能是在 const 之外最好的聯接類型了,簡單的 select 查詢不會出現這種 type。
mysql> explain select * from film_actor left join film on film_actor.film_id = film.id; 
 

ref:相比 eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分前綴,索引要和某個值相比較,可能會找到多個符合條件的行。
1. 簡單 select 查詢,name是普通索引(非唯一索引) mysql> explain select * from film where name = "film1"; 
 

2.關聯表查詢,idx_film_actor_id是film_id和actor_id的聯合索引,這裏使用到了film_actor的左邊前綴film_id部分。 mysql> explain select film_id from film left join film_actor on film.id = film_actor.film_id; 
 

range:範圍掃描通常出現在 in(), between ,> ,<, >= 等操作中。使用一個索引來檢索給定範圍的行。
mysql> explain select * from actor where id > 1;
 

index:掃描全表索引,這通常比ALL快一些。(index是從索引中讀取的,而all是從硬盤中讀取)
mysql> explain select * from film; 
 

ALL:即全表掃描,意味着mysql需要從頭到尾去查找所需要的行。通常情況下這需要增加索引來進行優化了
mysql> explain select * from actor; 
 
 
5. possible_keys列
這一列顯示查詢可能使用哪些索引來查找。 
explain 時可能出現 possible_keys 有列,而 key 顯示 NULL 的情況,這種情況是因爲表中數據不多,mysql認爲索引對此查詢幫助不大,選擇了全表查詢。 
如果該列是NULL,則沒有相關的索引。在這種情況下,可以通過檢查 where 子句看是否可以創造一個適當的索引來提高查詢性能,然後用 explain 查看效果。

6. key列
這一列顯示mysql實際採用哪個索引來優化對該表的訪問。
如果沒有使用索引,則該列是 NULL。如果想強制mysql使用或忽視possible_keys列中的索引,在查詢中使用 force index、ignore index。

7. key_len列
這一列顯示了mysql在索引裏使用的字節數,通過這個值可以算出具體使用了索引中的哪些列。 
舉例來說,film_actor的聯合索引 idx_film_actor_id 由 film_id 和 actor_id 兩個int列組成,並且每個int是4字節。通過結果中的key_len=4可推斷出查詢使用了第一個列:film_id列來執行索引查找。
mysql> explain select * from film_actor where film_id = 2;
 
key_len計算規則如下:
    字符串
    char(n):n字節長度
    varchar(n):2字節存儲字符串長度,如果是utf-8,則長度 3n + 2
    數值類型
    tinyint:1字節
    smallint:2字節
    int:4字節
    bigint:8字節  
    時間類型 
    date:3字節
    timestamp:4字節
    datetime:8字節
    如果字段允許爲 NULL,需要1字節記錄是否爲 NULL
索引最大長度是768字節,當字符串過長時,mysql會做一個類似左前綴索引的處理,將前半部分的字符提取出來做索引。

8. ref列
這一列顯示了在key列記錄的索引中,表查找值所用到的列或常量,常見的有:const(常量),字段名(例:film.id)

9. rows列
這一列是mysql估計要讀取並檢測的行數,注意這個不是結果集裏的行數。

10. Extra列
這一列展示的是額外信息。常見的重要值如下: 
Using index:查詢的列被索引覆蓋,並且where篩選條件是索引的前導列,是性能高的表現。一般是使用了覆蓋索引(索引包含了所有查詢的字段)。對於innodb來說,如果是輔助索引性能會有不少提高
mysql> explain select film_id from film_actor where film_id = 1;
 

Using where:查詢的列未被索引覆蓋,where篩選條件非索引的前導列
mysql> explain select * from actor where name = 'a';
 

Using where Using index:查詢的列被索引覆蓋,並且where篩選條件是索引列之一但是不是索引的前導列,意味着無法直接通過索引查找來查詢到符合條件的數據
mysql> explain select film_id from film_actor where actor_id = 1;
 

NULL:查詢的列未被索引覆蓋,並且where篩選條件是索引的前導列,意味着用到了索引,但是部分字段未被索引覆蓋,必須通過“回表”來實現,不是純粹地用到了索引,也不是完全沒用到索引
mysql>explain select * from film_actor where film_id = 1;
 

Using index condition:與Using where類似,查詢的列不完全被索引覆蓋,where條件中是一個前導列的範圍;
mysql> explain select * from film_actor where film_id > 1;
 

Using temporary:mysql需要創建一張臨時表來處理查詢。出現這種情況一般是要進行優化的,首先是想到用索引來優化。
1. actor.name沒有索引,此時創建了張臨時表來distinct mysql> explain select distinct name from actor; 
 
2. film.name建立了idx_name索引,此時查詢時extra是using index,沒有用臨時表 mysql> explain select distinct name from film; 
 

Using filesort:mysql 會對結果使用一個外部索引排序,而不是按索引次序從表裏讀取行。此時mysql會根據聯接類型瀏覽所有符合條件的記錄,並保存排序關鍵字和行指針,然後排序關鍵字並按順序檢索行信息。這種情況下一般也是要考慮使用索引來優化的。
1. actor.name未創建索引,會瀏覽actor整個表,保存排序關鍵字name和對應的id,然後排序name並檢索行記錄 mysql> explain select * from actor order by name; 
 
2. film.name建立了idx_name索引,此時查詢時extra是using indexmysql> explain select * from film order by name; 
 

索引最佳實踐
使用的表
CREATE TABLE `employees` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
  `age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡',
  `position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位',
  `hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間',
  PRIMARY KEY (`id`),
  KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='員工記錄表';

INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei', 23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());

最佳實踐
1. 全值匹配
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei';
 

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;
 

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
 

2.最佳左前綴法則
 如果索引了多列,要遵守最左前綴法則。指的是查詢從索引的最左前列開始並且不跳過索引中的列。
EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE position = 'manager';
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
 

3.不在索引列上做任何操作(計算、函數、(自動or手動)類型轉換),會導致索引失效而轉向全表掃描
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';
 

4.存儲引擎不能使用索引中範圍條件右邊的列
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';
 

5.儘量使用覆蓋索引(只訪問索引的查詢(索引列包含查詢列)),減少select *語句
EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
 
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
 

6.mysql在使用不等於(!=或者<>)的時候無法使用索引會導致全表掃描
EXPLAIN SELECT * FROM employees WHERE name != 'LiLei'
 

7.is null,is not null 也無法使用索引
EXPLAIN SELECT * FROM employees WHERE name is null
 

8.like以通配符開頭('$abc...')mysql索引失效會變成全表掃描操作
EXPLAIN SELECT * FROM employees WHERE name like '%Lei'
 
EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'
 

問題:解決like'%字符串%'索引不被使用的方法?
a)使用覆蓋索引,查詢字段必須是建立覆蓋索引字段
EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';
 
b)當覆蓋索引指向的字段是varchar(380)及380以上的字段時,覆蓋索引會失效!

9.字符串不加單引號索引失效
EXPLAIN SELECT * FROM employees WHERE name = '1000';
EXPLAIN SELECT * FROM employees WHERE name = 1000;
 

10.少用or,用它連接時很多情況下索引會失效
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';
 

總結:
 
like KK%相當於=常量,%KK和%KK% 相當於範圍

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章