MySQL索引知識介紹

前言:

索引是MySQL數據庫中的重要對象之一,索引的目的在於提高查詢效率。可以類比字典中的目錄,查找字典內容時可以根據目錄查找到數據的存放位置,然後直接獲取即可。索引是表的目錄,在查找內容之前可以先在目錄中查找索引位置,以此快速定位查詢數據。需要說明的是,MySQL支持諸多存儲引擎,而各種存儲引擎對索引的支持也各不相同。爲了避免混亂,本文將只關注於InnoDB引擎下的B+Tree索引。

1.索引結構及原理

要想了解索引的原理,首先要知道索引的結構,下面簡單介紹下B+Tree索引的結構。

首先我們要知道索引是一種數據結構。在InnoDB中,每個索引其實都是一顆B+樹,B+樹是爲了磁盤及其他存儲輔助設備而設計的一種平衡查找樹(不是二叉樹),在B+樹中,所有的數據都在葉子節點,且每一個葉子節點都帶有指向下一個節點的指針,形成了一個有序的鏈表。一般情況下數據庫的B+樹的高度一般在2~4層,這就是說找到某一鍵值的行記錄最多需要2到4次邏輯IO,下圖簡單展示了B+樹索引的結構。

image.png

2.索引的分類及創建方法

在InnoDB中,表都是根據主鍵順序以索引的形式存放的,這種存儲方式的表稱爲索引組織表。根據葉子節點的內容,索引類型分爲主鍵索引和非主鍵索引。主鍵索引的葉子節點存的是整行數據。在InnoDB裏,主鍵索引也被稱爲聚簇索引(clustered index)。非主鍵索引的葉子節點內容是索引列和主鍵的值。在InnoDB裏,非主鍵索引也被稱爲二級索引(secondary index)或輔助索引

一張InnoDB表必須有一個聚簇索引,當有主鍵時,會以主鍵作爲聚簇索引;如果沒有顯式定義主鍵,InnoDB會選擇一個唯一的非空索引代替。如果沒有這樣的索引,則MySQL自動爲InnoDB表生成一個隱含字段作爲主鍵。除聚簇索引外的其他索引都可稱爲二級索引,比如我們常用到的唯一索引、普通索引、聯合索引等。

上面講過聚簇索引的葉子節點存的是整行數據,當某條查詢使用的是聚簇索引時,只需要掃描聚簇索引一顆B+樹即可得到所需記錄,如果想通過二級索引來查找完整的記錄的話,需要通過回表操作,也就是在通過二級索引找到主鍵值之後再到聚簇索引中查找完整的記錄。也就是說,基於非主鍵索引的查詢需要多掃描一棵索引樹。因此,我們在應用中應該儘量使用主鍵查詢。

下面介紹下索引的創建、刪除等操作方法。

# 建表時指定索引
CREATE TABLE `t_index` (
  `increment_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
  `col1` int(11) NOT NULL,
  `col2` varchar(20) NOT NULL,
  `col3` varchar(50) NOT NULL,
  `col4` int(11) NOT NULL,
  PRIMARY KEY (`increment_id`),
  UNIQUE KEY `uk_col1` (`col1`),
	KEY `idx_col2` (`col2`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COMMENT='測試索引';

# 創建索引(兩種方法)
# 普通索引
alter table `t_index` add index idx_col3 (col3);
create index idx_col3 on t_index(col3);
# 唯一索引
alter table `t_index` add unique index uk_col4 (col4);
create unique index uk_col4 on t_index(col4);
# 聯合索引
alter table `t_index` add index idx_col3_col4 (col3,col4);
create index idx_col3_col4 on t_index(col3,col4);

# 刪除索引
alter table `t_index` drop index uk_col4;
DROP INDEX idx_col3_col4 on t_index;

3.索引的優缺點及使用建議

索引的優點顯而易見是可以加速查詢,但創建索引也是有代價的。首先每建立一個索引都要爲它建立一棵B+樹,會佔用額外的存儲空間;其次當對錶中的數據進行增加、刪除、修改時,索引也需要動態的維護,降低了數據的維護速度。所以,索引的創建及使用時有原則的,下面給出幾點索引使用的建議:

  • 顯式創建主鍵索引,建議使用自增ID作爲主鍵。
  • 只爲用於搜索、排序、分組、連接的列創建索引。
  • 對經常更新的表避免創建過多的索引。
  • 建立聯合索引時,可選擇性高的列放在前面。
  • 儘量不要在可選擇性差的列上建索引,如:性別、狀態列等。
  • 儘量使用覆蓋索引進行查詢,避免回錶帶來的性能損耗。(覆蓋索引包含要查詢的所有列)
  • select後面只寫查詢需要用到的字段,去掉不需要的字段。
  • 定位並刪除表中的重複和冗餘索引。

總結:

其實很早就想寫篇索引相關的文章,但一直沒有完成,因爲關於索引的文章太多了!大多也是大同小異,而且想深入解析索引需要算法相關知識,講明白索引並不是一件容易的事。當然,本篇文章也寫得很普通,只是介紹下在項目開發中實用的一些知識,索引的內容還有很多,需要我們不斷的去學習。

wx_blog.png

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章