學習阿里巴巴開發手冊-12

索引規約

1.業務上具有唯一特性的字段,即使是組合字段,也必須建成唯一索引。說明:不要以爲唯一索引影響了 insert 速度,這個速度損耗可以忽略,但提高查找速度是明顯的;另外,

   即使在應用層做了非常完善的校驗和控制,只要沒有唯一索引,根據墨菲定律,必然有髒數據產生。

2.超過三個表禁止 join。需要 join 的字段,數據類型保持絕對一致;多表關聯查詢時,保證被關聯的字段需要有索引。說明:即使雙表 join 也要注意表索引、SQL 性能。

3.在 varchar 字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度。說明:索引的長度與區分度是一對矛盾體,一般對字符串類

   型數據,長度爲 20 的索引,區分度會高達 90%以上,可以使用 count(distinct left(列名, 索引長度))/count(*)的區分度來確定。

4.頁面搜索嚴禁左模糊或者全模糊,不走索引;如果需要請走搜索引擎來解決。說明:索引文件具有 B-Tree 的最左前綴匹配特性,如果左邊的值未確定,那麼無法使用此索引。

5.如果有 order by 的場景,請注意利用索引的有序性。order by 最後的字段是組合索引的一部分,並且放在索引組合順序的最後,避免出現 file_sort 的情況,影響查詢性能。

   正例:where a=? and b=? order by c; 索引:a_b_c反例:索引中有範圍查找,那麼索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引 a_b無法排序。

6.利用覆蓋索引來進行查詢操作,來避免回表操作。

   說明:如果一本書需要知道第 11 章是什麼標題,會翻開第 11 章對應的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。正例:IDB 能夠建立索引的種類:

   主鍵索引、唯一索引、普通索引,而覆蓋索引是一種查詢的一種效果,用 explain 的結果,extra 列會出現:using index.

7.SQL 性能優化的目標:至少要達到 range 級別,要求是 ref 級別,如果可以consts最好。

   說明:1)consts 單表中最多隻有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到數據。

              2)ref 指的是使用普通的索引。(normal index)

              3)range 對索引進範圍檢索。反例:explain 表的結果,type=index,索引物理文件全掃描,速度非常慢,這個 index 級別比較 range 還低,與全表掃描是小巫見大巫

8.利用延遲關聯或者子查詢優化超多分頁場景。說明:MySQL 並不是跳過 offset 行,而是取 offset+N 行,然後返回放棄前 offset 行,返回 N行,那當 offset 特別大的時候,效 

   率就非常的低下,要麼控制返回的總頁數,要麼對超過特定閾值的頁數進行 SQL 改寫。

   正例:先快速定位需要獲取的 id 段,然後再關聯:SELECT a.* FROM 表 1 a, (select id from 表 1 where 條件 LIMIT 100000,20 ) b where a.id=b.id

9.建組合索引的時候,區分度最高的在最左邊。

   正例:如果 where a=? and b=? ,a 列的幾乎接近於唯一值,那麼只需要單建 idx_a 索引即可。

   說明:存在非等號和等號混合判斷條件時,在建索引時,請把等號條件的列前置。如:where a>?and b=? 那麼即使 a 的區分度更高,也必須把 b 放在索引的最前列

10.防止因字段類型不同造成的隱式轉換,導致索引失效。

11.創建索引時避免有如下極端誤解:

     1)誤認爲一個查詢就需要建一個索引。

     2)誤認爲索引會消耗空間、嚴重拖慢更新和新增速度。

     3)誤認爲唯一索引一律需要在應用層通過“先查後插”方式解決。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章