面試官：看到你熟練性能調優，可以說一下你對MySQL索引的理解？

原創

wx5d9ed7c8443c3

2020-04-24 16:26

MySQL索引？這玩意兒還能簡單聊？明顯是在挖坑，幸好老夫早有準備，切聽我一一道來。

一、索引是什麼？

索引是幫助MySQL高效獲取數據的數據結構。

二、索引能幹什麼？

索引非常關鍵，尤其是當表中的數據量越來越大時，索引對於性能的影響愈發重要。索引能夠輕易將查詢性能提高好幾個數量級，總的來說就是可以明顯的提高查詢效率。

三、索引的分類？

1、從存儲結構上來劃分：BTree索引（B-Tree或B+Tree索引），Hash索引，full-index全文索引，R-Tree索引。這裏所描述的是索引存儲時保存的形式，

2、從應用層次來分：普通索引，唯一索引，複合索引

3、根據中數據的物理順序與鍵值的邏輯（索引）順序關係：聚集索引，非聚集索引。

平時講的索引類型一般是指在應用層次的劃分。

就像手機分類：安卓手機，IOS手機與華爲手機，蘋果手機，OPPO手機一樣。

普通索引：即一個索引只包含單個列，一個表可以有多個單列索引

唯一索引：索引列的值必須唯一，但允許有空值

複合索引：多列值組成一個索引，專門用於組合搜索，其效率大於索引合併

聚簇索引(聚集索引)：並不是一種單獨的索引類型，而是一種數據存儲方式。具體細節取決於不同的實現，InnoDB的聚簇索引其實就是在同一個結構中保存了B-Tree索引(技術上來說是B+Tree)和數據行。

非聚簇索引：不是聚簇索引，就是非聚簇索引

四、索引的底層實現

mysql默認存儲引擎innodb只顯式支持B-Tree( 從技術上來說是B+Tree)索引，對於頻繁訪問的表，innodb會透明建立自適應hash索引，即在B樹索引基礎上建立hash索引，可以顯著提高查找效率，對於客戶端是透明的，不可控制的，隱式的。

不談存儲引擎，只討論實現(抽象)

Hash索引

基於哈希表實現，只有精確匹配索引所有列的查詢纔有效，對於每一行數據，存儲引擎都會對所有的索引列計算一個哈希碼（hash code），並且Hash索引將所有的哈希碼存儲在索引中，同時在索引表中保存指向每個數據行的指針。

B-Tree索引（MySQL使用B+Tree）

B-Tree能加快數據的訪問速度，因爲存儲引擎不再需要進行全表掃描來獲取數據，數據分佈在各個節點之中。

B+Tree索引

是B-Tree的改進版本，同時也是數據庫索引索引所採用的存儲結構。數據都在葉子節點上，並且增加了順序訪問指針，每個葉子節點都指向相鄰的葉子節點的地址。相比B-Tree來說，進行範圍查找時只需要查找兩個節點，進行遍歷即可。而B-Tree需要獲取所有節點，相比之下B+Tree效率更高。

結合存儲引擎來討論（一般默認使用B+Tree）

案例：假設有一張學生表，id爲主鍵

id	name	birthday
1	Tom	1996-01-01
2	Jann	1996-01-04
3	Ray	1996-01-08
4	Michael	1996-01-10
5	Jack	1996-01-13
6	Steven	1996-01-23
7	Lily	1996-01-25

在MyISAM引擎中的實現（二級索引也是這樣實現的）

在InnoDB中的實現

五、爲什麼索引結構默認使用B+Tree，而不是Hash，二叉樹，紅黑樹？

B-tree：因爲B樹不管葉子節點還是非葉子節點，都會保存數據，這樣導致在非葉子節點中能保存的指針數量變少（有些資料也稱爲扇出），指針少的情況下要保存大量數據，只能增加樹的高度，導致IO操作變多，查詢性能變低；

Hash：雖然可以快速定位，但是沒有順序，IO複雜度高。

二叉樹：樹的高度不均勻，不能自平衡，查找效率跟數據有關（樹的高度），並且IO代價高。

紅黑樹：樹的高度隨着數據量增加而增加，IO代價高。

六、爲什麼官方建議使用自增長主鍵作爲索引？

結合B+Tree的特點，自增主鍵是連續的，在插入過程中儘量減少頁分裂，即使要進行頁分裂，也只會分裂很少一部分。並且能減少數據的移動，每次插入都是插入到最後。總之就是減少分裂和移動的頻率。

插入連續的數據：

插入非連續的數據：

七、簡單總結下

1、MySQL使用B+Tree作爲索引數據結構。
2、B+Tree在新增數據時，會根據索引指定列的值對舊的B+Tree做調整。
3、從物理存儲結構上說，B-Tree和B+Tree都以頁(4K)來劃分節點的大小，但是由於B+Tree中中間節點不存儲數據，因此B+Tree能夠在同樣大小的節點中，存儲更多的key，提高查找效率。
4、影響MySQL查找性能的主要還是磁盤IO次數，大部分是磁頭移動到指定磁道的時間花費。
5、MyISAM存儲引擎下索引和數據存儲是分離的，InnoDB索引和數據存儲在一起。
6、InnoDB存儲引擎下索引的實現，(輔助索引)全部是依賴於主索引建立的(輔助索引中葉子結點存儲的並不是數據的地址，還是主索引的值，因此，所有依賴於輔助索引的都是先根據輔助索引查到主索引，再根據主索引查數據的地址)。
7、由於InnoDB索引的特性，因此如果主索引不是自增的(id作主鍵)，那麼每次插入新的數據，都很可能對B+Tree的主索引進行重整，影響性能。因此，儘量以自增id作爲InnoDB的主索引。

共同進步，學習分享

歡迎大家關注我的公衆號【風平浪靜如碼】，海量Java相關文章，學習資料都會在裏面更新，整理的資料也會放在裏面。

覺得寫的還不錯的就點個贊，加個關注唄！點關注，不迷路，持續更新！！！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

面試官：看到你熟練性能調優，可以說一下你對MySQL索引的理解？

一、索引是什麼？

二、索引能幹什麼？

三、索引的分類？

四、索引的底層實現

五、爲什麼索引結構默認使用B+Tree，而不是Hash，二叉樹，紅黑樹？

六、爲什麼官方建議使用自增長主鍵作爲索引？

七、簡單總結下

共同進步，學習分享

致遠OA及相關OA系統集成與二次開發

EXCEL公式使用總結

System.Object未被引用的程序集中定義

Java 信號量（semaphore）搭配CountDownLatch 實現多線程處理循環內邏輯並限制創建線程數

[轉帖]linux命令top內存顯示M兆或者G

【面試準備】項目經驗——接口自動化項目

超值乾貨 | 值得收藏：精選BATJ面試突擊500題詳解：JVM篇！

備戰詳解22道Java面試常問集合框架面試真題，讓面試官無話可說！

面試害怕被問Nginx？一文帶你解析Nginx基本概念！（附資料分享）

面試官：看到你熟練性能調優，可以說一下你對MySQL索引的理解？

超硬核！16000 字 Redis 面試知識點總結，這還不趕緊收藏？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結