MySQL的索引有哪幾種?

索引是什麼?

MySQL索引的建立對於MySQL的高效運行是很重要的,索引可以大大提高MySQL的檢索速度。

打個比方,如果合理的設計且使用索引的MySQL是一輛蘭博基尼的話,那麼沒有設計和使用索引的MySQL就是一個人力三輪車。

索引分單列索引和組合索引。單列索引,即一個索引只包含單個列,一個表可以有多個單列索引,但這不是組合索引。組合索引,即一個索引包含多個列。

創建索引時,你需要確保該索引是應用在 SQL 查詢語句的條件(一般作爲 WHERE 子句的條件)。

實際上,索引也是一張表,該表保存了主鍵與索引字段,並指向實體表的記錄。

上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因爲更新表時,MySQL不僅要保存數據,還要保存一下索引文件。

建立索引會佔用磁盤空間的索引文件。

索引的分類

一、按表列屬性分類

單列索引

以表的單個列字段創建的索引

聯合索引

以表的多個列字段組合創建的索引,在查詢條件使用索引的從左字段順序纔會生效,遵循最左匹配原則。

單列索引和聯合索引又包括:

普通索引

非主鍵,非唯一列的索引

主鍵索引

基於該表主鍵自動生成成的索引,如果未給表定義主鍵,會查找該表中是否存在非空、整形、唯一索引作爲其主鍵(可通過select _rowid from 表名查看),若都不滿足會隱式生成一個rowid作爲主鍵(無法直接查到)

唯一索引

基於表的唯一列生成的索引,允許爲空值

全文索引

將存儲於數據庫中的整本書或整篇文章中任意內容信息查找出來,如大量級的文字中如like %關鍵字%,普通索引的效率與全文索引相比是非常低的。

二、按數據結構分類

B+tree索引

b+tree基於平衡二叉樹的一種多路平衡查找樹,所有記錄都按照順序存放在葉子節點中,各個葉子節點直接通過鏈表相連。與b樹不同的是:

非葉子節點只存儲鍵值信息。

所有葉子節點之間都有一個鏈指針。

數據記錄都存放在葉子節點中。

hash索引

基於hash表結構實現的索引,mysql中只有MEMORY/HEAP和NDB存儲引擎支持;

InnoDB引擎支持自適應hash索引,但是是數據庫自身創建使用的,而不能進行人爲定義。當二級索引被頻繁的訪問時,便會自動創建自適應哈希索引;

通過 命令SHOW ENGINE INNODB STATUS可查看自適應hash索引的使用情況;

通過 命令SHOW VARIABLES LIKE '%ap%hash_index' 查看是否打開自適應hash索引。

對比:

由於hash索引是比較其hash值,hash索引只能進行等值查找而不能進行範圍查找

hash索引無法進行排序:原因同上

不支持最左匹配原則,複合索引時合併一起計算hash值

hash索引的檢索效率很高可以一次定位,但是當發生大量hash碰撞的時候,鏈表變長,hash索引效率上是不如b+tree的

由於存在hash碰撞的問題,當需要獲得總數時候,hash 索引在任何時候都不能避免表掃描

T-tree索引

R-tree索引

三、按存儲結構分類

聚簇索引(聚集索引)

InnoDB的聚簇索引實際上是在同一個BTree結構中同時存儲了索引和整行數據,通過該索引查詢可以直接獲取查詢數據行。

聚簇索引不是一種單獨的索引類型,而是一種數據的存儲方式,聚簇索引的順序,就是數據在硬盤上的物理順序。

在mysql通常聚簇索引是主鍵的同義詞,每張表只包含一個聚簇索引(其他數據庫不一定)。

輔助索引(非聚集索引,次級索引,二級索引)

非聚集索引在BTree的葉子節點中保存了索引列和主鍵。如果查詢列不在該索引內,只能查到其主鍵值,還需要回表操作查詢聚簇索引進行查詢。

聚簇索引的優點:

可以把相關數據保存在一起,如:實現電子郵箱時,可以根據用戶ID來聚集數據,這樣只需要從磁盤讀取少量的數據頁就能獲取某個用戶全部郵件,如果沒有使用聚集索引,則每封郵件都可能導致一次磁盤IO。

數據訪問更快,聚集索引將索引和數據保存在同一個btree中,因此從聚集索引中獲取數據通常比在非聚集索引中查找要快。

使用覆蓋索引掃描的查詢可以直接使用頁節點中的主鍵值。

聚簇索引的缺點:

聚簇數據最大限度地提高了IO密集型應用的性能,但如果數據全部放在內存中,則訪問的順序就沒有那麼重要了,聚集索引也沒有什麼優勢了

插入速度嚴重依賴於插入順序,按照主鍵的順序插入是加載數據到innodb表中速度最快的方式,但如果不是按照主鍵順序加載數據,那麼在加載完成後最好使用optimize table命令重新組織一下表。

更新聚集索引列的代價很高,因爲會強制innodb將每個被更新的行移動到新的位置。

基於聚集索引的表在插入新行,或者主鍵被更新導致需要移動行的時候,可能面臨頁分裂的問題,當行的主鍵值要求必須將這一行插入到某個已滿的頁中時,存儲引擎會將該頁分裂成兩個頁面來容納該行,這就是一次頁分裂操作,頁分裂會導致表佔用更多的磁盤空間。

聚集索引可能導致全表掃描變慢,尤其是行比較稀疏,或者由於頁分裂導致數據存儲不連續的時候。

二級索引可能比想象的更大,因爲在二級索引的葉子節點包含了引用行的主鍵列。

二級索引訪問需要兩次索引查找,而不是一次。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章