27.【轉載】如何避免回表查詢,什麼是索引覆蓋

原文:《如何避免回表查詢?什麼是索引覆蓋?》

數據庫表結構:

1
2
3
4
5
6
create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;
1
2
3
select id,name where name='shenjian'
 
select id,name,sex where name='shenjian'

多查詢了一個屬性,爲何檢索過程完全不同?

 

  什麼是回表查詢?

  什麼是索引覆蓋?

  如何實現索引覆蓋?

哪些場景,可以利用索引覆蓋來優化SQL?

 

這些,這是今天要分享的內容。

畫外音:本文試驗基於MySQL5.6-InnoDB。

 

一、什麼是回表查詢?

這先要從InnoDB的索引實現說起,InnoDB有兩大類索引:

  • 聚集索引(clustered index)

  • 普通索引(secondary index)

 

InnoDB聚集索引和普通索引有什麼差異?

 

InnoDB聚集索引的葉子節點存儲行記錄,因此, InnoDB必須要有,且只有一個聚集索引:

(1)如果表定義了PK,則PK就是聚集索引;

(2)如果表沒有定義PK,則第一個not NULL unique列是聚集索引;

(3)否則,InnoDB會創建一個隱藏的row-id作爲聚集索引;

畫外音:所以PK查詢非常快,直接定位行記錄。

 

InnoDB普通索引的葉子節點存儲主鍵值。

 畫外音:注意,不是存儲行記錄頭指針,MyISAM的索引葉子節點存儲記錄指針。

 

舉個栗子,不妨設有表:

  t(id PK, name KEY, sex, flag);

畫外音:id是聚集索引,name是普通索引。

 

表中有四條記錄:

  1, shenjian, m, A

  3, zhangsan, m, A

  5, lisi, m, A

  9, wangwu, f, B

兩個B+樹索引分別如上圖:

  (1)id爲PK,聚集索引,葉子節點存儲行記錄;

  (2)name爲KEY,普通索引,葉子節點存儲PK值,即id;

 

既然從普通索引無法直接定位行記錄,那普通索引的查詢過程是怎麼樣的呢?

通常情況下,需要掃碼兩遍索引樹。

 

例如:

1
select from where name='lisi'; 

是如何執行的呢?

粉紅色路徑,需要掃碼兩遍索引樹:

(1)先通過普通索引定位到主鍵值id=5;

(2)在通過聚集索引定位到行記錄;

 

這就是所謂的回表查詢,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。

 

二、什麼是索引覆蓋(Covering index)

額,樓主並沒有在MySQL的官網找到這個概念。

畫外音:治學嚴謹吧?

 

借用一下SQL-Server官網的說法。

 

MySQL官網,類似的說法出現在explain查詢計劃優化章節,即explain的輸出結果Extra字段爲Using index時,能夠觸發索引覆蓋。

不管是SQL-Server官網,還是MySQL官網,都表達了:只需要在一棵索引樹上就能獲取SQL所需的所有列數據,無需回表,速度更快。

 

三、如何實現索引覆蓋?

常見的方法是:將被查詢的字段,建立到聯合索引裏去。

 

仍是之前中的例子:

1
2
3
4
5
6
create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;

第一個SQL語句:  

 

1
select id,name from user where name='shenjian'; 

能夠命中name索引,索引葉子節點存儲了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。

畫外音,Extra:Using index

 

第二個SQL語句:                 

1
select id,name,sex from user where name='shenjian';

能夠命中name索引,索引葉子節點存儲了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會降低。

畫外音,Extra:Using index condition

 

如果把(name)單列索引升級爲聯合索引(name, sex)就不同了。

1
2
3
4
5
6
create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name, sex)
)engine=innodb;

可以看到:

1
2
3
select id,name ... where name='shenjian';
 
select id,name,sex ... where name='shenjian';

都能夠命中索引覆蓋,無需回表。

畫外音,Extra:Using index

 

 

四、哪些場景可以利用索引覆蓋來優化SQL?

場景1:全表count查詢優化

原表爲:

user(PK id, name, sex);

 

直接:

1
select count(namefrom user;

不能利用索引覆蓋。

 

添加索引:

1
alter table user add key(name);

就能夠利用索引覆蓋提效。

 

場景2:列查詢回表優化

1
select id,name,sex ... where name='shenjian';

這個例子不再贅述,將單列索引(name)升級爲聯合索引(name, sex),即可避免回表。

 

場景3:分頁查詢

1
select id,name,sex ... order by name limit 500,100;

將單列索引(name)升級爲聯合索引(name, sex),也可以避免回表。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章