1. 說說你對索引的認識?
- 索引是幫助 SQL 高效獲取數據的一種數據結構。
2. 既然你說索引是一種數據結構,那它底層到底是什麼呢?
- 索引底層數據結構主要有兩種,B+ 樹和 Hash 表,InnoDB 用的就是 B+ 樹。
3. B+ 樹索引和 Hash 索引有什麼區別呢?
- B+ 樹索引天然有序,左子節點小於父節點,右子節點大於父節點。葉子節點存放數據行或者主鍵,所有葉子節點之間形成一條鏈相互關聯。因爲 B+ 樹有序,所以它不僅可以用於等值查詢,還可以用於範圍查詢。由於數據存放在葉子節點,每次檢索都要從父節點開始,檢索的效率不是很高;
- Hash 索引用的是 Hash 表來存儲,直接根據鍵值對進行映射,因此只能用於等值查詢,且效率很高。它也沒辦法用索引來進行排序。
4. B+ 樹葉子節點可以存放哪些東西?
- 可以存放數據行,也可以存放主鍵的值。存放數據行時,叫做聚簇索引,也叫主鍵索引,存放主鍵的值時,叫做非聚簇索引,也叫非主鍵索引。InnoDB 默認用的都是聚簇索引。
5. 聚簇索引和非聚簇索引在查詢數據時有什麼區別?
- 聚簇索引更快,因爲葉子節點存放的是數據行,不需要回表查詢。
6. 非聚簇索引一定要回表查詢嗎?
- 不一定,正常情況是查到拿到葉子節點存儲的主鍵的值,然後再根據主鍵值去做回表查詢,但如果是索引覆蓋的情況,就不需要回表查詢了。
7. 什麼叫索引覆蓋?
- 索引覆蓋就是查詢的字段都建了索引,數據可以直接從索引中獲取,不需要查詢數據表。
8. 使用索引有哪些優缺點?
- 優點:提高檢索效率,提高排序的效率;
- 缺點:降低了寫數據的效率,因爲寫數據的同時還要維護索引;索引也佔用額外的空間。
9. 如果要對用戶密碼字段建索引,你打算建什麼索引?
- 密碼字段可以用前綴索引,比如用密碼字段的前 10 位做索引,因爲前 10 位的標識度也夠高了。前綴索引可以節省空間。
10. 創建聯合索引的時候怎麼確定哪個字段放前面?
- 識別度最高的字段放到最前面,這樣可以提高效率。
11. MySQL 5.6 開始對索引做了什麼優化,瞭解嗎?
- 做了索引下推的優化,索引下推可以減少回表查詢的次數。比如建立了聯合索引
index(name, age)
,然後查詢select * from user where name like '張%' and age = 20
,沒有索引下推的話,MySQL 會把name like '張%'
的數據都返回到 MySQL 服務端,服務端再去判斷這些數據的 age 是否爲 20;而有了索引下推的話,查詢的時候會先判斷name like '張%'
的這些數據 age 是否爲 20,不是的直接忽略。
12. 你認爲哪些情況適合建索引?哪些情況不適合建索引?
- 頻繁作爲查詢條件的字段、排序字段、統計和分組的字段以及與其他表關聯的字段應該建立索引;
- 頻繁更新的字段以及字段值大量重複的不適合建立索引。
13. 使用索引的時候你會遵循哪些原則?
- 全值匹配是最理想的狀態,即查詢條件字段都建立了索引且順序和索引順序一致;
- 遵循最左前綴法則,比如索引順序是 A、B、C,那麼查詢條件一定要有 A,否則 B 和 C 都會失效;中間索引頁不能斷,如果查詢條件是 A 和 C,少了 B,那麼 C 也會失效;
- 索引列上不要做任何計算,計算將導致索引失效;
- 範圍之後的列索引會失效,比如
name like '張% and age = 20'
,那麼 age 這個索引將失效;- 寫模糊查詢時百分號要寫右邊,否則索引失效;
- 不要寫
select *
,用到什麼列就查什麼列,這樣可以增加索引覆蓋的機率;- 不等於、is null、is not null、or 這些都會導致索引失效;
- 字符串的引號不能漏寫,否則索引會失效。
輔助記憶,詩曰:
全值匹配我最愛, 最左前綴要遵守;
帶頭大哥不能死, 中間兄弟不能斷;
索引列上少計算, 範圍之後全失效;
模糊百分寫最右, 覆蓋索引不寫星;
不等空值還有或, 索引失效要少用;
字符引號不可丟, 牢記以上就無憂。