27.【轉載】如何避免回表查詢，什麼是索引覆蓋

數據庫表結構：

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;

select id,name where name='shenjian'
 
select id,name,sex where name='shenjian'

多查詢了一個屬性，爲何檢索過程完全不同？

　　什麼是回表查詢？

　　什麼是索引覆蓋？

　　如何實現索引覆蓋？

哪些場景，可以利用索引覆蓋來優化SQL？

這些，這是今天要分享的內容。

畫外音：本文試驗基於MySQL5.6-InnoDB。

一、什麼是回表查詢？

這先要從InnoDB的索引實現說起，InnoDB有兩大類索引：

聚集索引(clustered index)
普通索引(secondary index)

InnoDB聚集索引和普通索引有什麼差異？

InnoDB聚集索引的葉子節點存儲行記錄，因此， InnoDB必須要有，且只有一個聚集索引：

（1）如果表定義了PK，則PK就是聚集索引；

（2）如果表沒有定義PK，則第一個not NULL unique列是聚集索引；

（3）否則，InnoDB會創建一個隱藏的row-id作爲聚集索引；

畫外音：所以PK查詢非常快，直接定位行記錄。

InnoDB普通索引的葉子節點存儲主鍵值。

　畫外音：注意，不是存儲行記錄頭指針，MyISAM的索引葉子節點存儲記錄指針。

舉個栗子，不妨設有表：

　　t(id PK, name KEY, sex, flag);

畫外音：id是聚集索引，name是普通索引。

表中有四條記錄：

　　1, shenjian, m, A

　　3, zhangsan, m, A

　　5, lisi, m, A

　　9, wangwu, f, B

兩個B+樹索引分別如上圖：

　　（1）id爲PK，聚集索引，葉子節點存儲行記錄；

　　（2）name爲KEY，普通索引，葉子節點存儲PK值，即id；

既然從普通索引無法直接定位行記錄，那普通索引的查詢過程是怎麼樣的呢？

通常情況下，需要掃碼兩遍索引樹。

例如：

select * from t where name='lisi';　

是如何執行的呢？

如粉紅色路徑，需要掃碼兩遍索引樹：

（1）先通過普通索引定位到主鍵值id=5；

（2）在通過聚集索引定位到行記錄；

這就是所謂的回表查詢，先定位主鍵值，再定位行記錄，它的性能較掃一遍索引樹更低。

二、什麼是索引覆蓋(Covering index)？

額，樓主並沒有在MySQL的官網找到這個概念。

畫外音：治學嚴謹吧？

借用一下SQL-Server官網的說法。

MySQL官網，類似的說法出現在explain查詢計劃優化章節，即explain的輸出結果Extra字段爲Using index時，能夠觸發索引覆蓋。

不管是SQL-Server官網，還是MySQL官網，都表達了：只需要在一棵索引樹上就能獲取SQL所需的所有列數據，無需回表，速度更快。

三、如何實現索引覆蓋？

常見的方法是：將被查詢的字段，建立到聯合索引裏去。

仍是之前中的例子：

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;

第一個SQL語句：　　

select id,name from user where name='shenjian';　

能夠命中name索引，索引葉子節點存儲了主鍵id，通過name的索引樹即可獲取id和name，無需回表，符合索引覆蓋，效率較高。

畫外音，Extra：Using index。

第二個SQL語句：

select id,name,sex from user where name='shenjian';

能夠命中name索引，索引葉子節點存儲了主鍵id，但sex字段必須回表查詢才能獲取到，不符合索引覆蓋，需要再次通過id值掃碼聚集索引獲取sex字段，效率會降低。

畫外音，Extra：Using index condition。

如果把(name)單列索引升級爲聯合索引(name, sex)就不同了。

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name, sex)
)engine=innodb;

可以看到：

select id,name ... where name='shenjian';
 
select id,name,sex ... where name='shenjian';

都能夠命中索引覆蓋，無需回表。

畫外音，Extra：Using index。

四、哪些場景可以利用索引覆蓋來優化SQL？

場景1：全表count查詢優化

原表爲：

user(PK id, name, sex)；

直接：

select count(name) from user;

不能利用索引覆蓋。

添加索引：

alter table user add key(name);

就能夠利用索引覆蓋提效。

場景2：列查詢回表優化

select id,name,sex ... where name='shenjian';

這個例子不再贅述，將單列索引(name)升級爲聯合索引(name, sex)，即可避免回表。

場景3：分頁查詢

select id,name,sex ... order by name limit 500,100;

將單列索引(name)升級爲聯合索引(name, sex)，也可以避免回表。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

27.【轉載】如何避免回表查詢，什麼是索引覆蓋

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

14.Spring自帶定時任務時間配置說明

1.【原創】MongoDB的基本CRUD操作

15.【設計模式.行爲型.策略模式】策略模式實現

14.【設計模式.結構型.代理模式】代理模式的的實現

6.【原創】使用Java8中的Stream特性篩選數據

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結