MyISAM與InnoDB的索引,究竟有什麼差異?

數據庫的索引分爲主鍵索引(Primary Inkex)與普通索引(Secondary Index)。InnoDB和MyISAM是怎麼利用B+樹來實現這兩類索引,其又有什麼差異呢?這是今天要聊的內容。

一,MyISAM的索引
MyISAM的索引與行記錄是分開存儲的,叫做非聚集索引(UnClustered Index)。

其主鍵索引與普通索引沒有本質差異:
(1)有連續聚集的區域單獨存儲行記錄;
(2)主鍵索引的葉子節點,存儲主鍵,與對應行記錄的指針;
(3)普通索引的葉子結點,存儲索引列,與對應行記錄的指針;
畫外音:MyISAM的表可以沒有主鍵。

主鍵索引與普通索引是兩棵獨立的索引B+樹,通過索引列查找時,先定位到B+樹的葉子節點,再通過指針定位到行記錄。

舉個例子,MyISAM:
t(id PK, name KEY, sex, flag);

表中有四條記錄:
1, shenjian, m, A

3, zhangsan, m, A

5, lisi, m, A

9, wangwu, f, B

其B+樹索引構造如上圖:
(1)行記錄單獨存儲;
(2)id爲PK,有一棵id的索引樹,葉子指向行記錄;
(3)name爲KEY,有一棵name的索引樹,葉子也指向行記錄;

二、InnoDB的索引
InnoDB的主鍵索引與行記錄是存儲在一起的,故叫做聚集索引(Clustered Index):
(1)沒有單獨區域存儲行記錄;
(2)主鍵索引的葉子節點,存儲主鍵,與對應行記錄(而不是指針);
畫外音:因此,InnoDB的PK查詢是非常快的。

因爲這個特性,InnoDB的表必須要有聚集索引:
(1)如果表定義了PK,則PK就是聚集索引;
(2)如果表沒有定義PK,則第一個非空unique列是聚集索引;
(3)否則,InnoDB會創建一個隱藏的row-id作爲聚集索引;

聚集索引,也只能夠有一個,因爲數據行在物理磁盤上只能有一份聚集存儲。

InnoDB的普通索引可以有多個,它與聚集索引是不同的:
(1)普通索引的葉子節點,存儲主鍵(也不是指針);

對於InnoDB表,這裏的啓示是:
(1)不建議使用較長的列做主鍵,例如char(64),因爲所有的普通索引都會存儲主鍵,會導致普通索引過於龐大;
(2)建議使用趨勢遞增的key做主鍵,由於數據行與索引一體,這樣不至於插入記錄時,有大量索引分裂,行記錄移動;

仍是上面的例子,只是存儲引擎換成InnoDB:
t(id PK, name KEY, sex, flag);

表中還是四條記錄:
1, shenjian, m, A

3, zhangsan, m, A

5, lisi, m, A

9, wangwu, f, B

其B+樹索引構造如上圖:
(1)id爲PK,行記錄和id索引樹存儲在一起;
(2)name爲KEY,有一棵name的索引樹,葉子存儲id;

當:
select * from t where name=‘lisi’;

會先通過name輔助索引定位到B+樹的葉子節點得到id=5,再通過聚集索引定位到行記錄。
畫外音:所以,其實掃了2遍索引樹。

三,總結
MyISAM和InnoDB都使用B+樹來實現索引:
(1)MyISAM的索引與數據分開存儲;
(2)MyISAM的索引葉子存儲指針,主鍵索引與普通索引無太大區別;
(3)InnoDB的聚集索引和數據行統一存儲;
(4)InnoDB的聚集索引存儲數據行本身,普通索引存儲主鍵;
(5)InnoDB一定有且只有一個聚集索引;
(6)InnoDB建議使用趨勢遞增整數作爲PK,而不宜使用較長的列作爲PK;

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章