MySQL性能管理及架構設計(二):數據庫結構優化、高可用架構設計、數據庫索引優化 轉

一、數據庫結構優化(非常重要

1.1 數據庫結構優化目的

    1、減少數據冗餘:(數據冗餘是指在數據庫中存在相同的數據,或者某些數據可以由其他數據計算得到),注意,儘量減少不代表完全避免數據冗餘;

  2、儘量避免數據維護中出現更新,插入和刪除異常:

       

        總結:要避免異常,需要對數據庫結構進行範式化設計

    3、節約數據存儲空間。

    4、提高查詢效率。

1.2 數據庫結構設計步驟

    1、需求分析:全面瞭解產品設計的存儲需求、數據處理需求、數據安全性與完整性;

    2、邏輯設計(重要):設計數據的邏輯存儲結構。數據實體之間的邏輯關係,解決數據冗餘和數據維護異常。數據範式可以幫助我們設計;

    3、物理設計:表結構設計,存儲引擎與列的數據類型

    4、維護優化:索引優化、存儲結構優化。

1.3 數據庫範式設計與反範式化

    傳送門:數據庫邏輯設計之三大範式通俗理解,一看就懂,書上說的太晦澀

1.4 物理設計

   

相關傳送門:MySQL中字段類型與合理的選擇字段類型;int(11)最大長度是多少?,varchar最大長度是多少

二、高可用架構設計

   

  

2.1 讀寫分離

   

    MaxScale:實現MySQL讀寫分離與負載均衡的中間件利器

三、數據庫索引優化(非常重要

3.1 兩種主要數據結構:B-tree和Hash

3.1.1 B-tree結構

   

B-tree索引的限制:

   

3.1.2 Hash結構

   

Hash索引的限制:

  • Hash索引必須進行二次查找
  • Hash索引無法用於排序
  • Hash索引不支持部分索引查找也不支持範圍查找
  • Hash索引中Hash碼的計算可能存在Hash衝突,不適合重複值很高的列,如性別,身份證比較合適。

3.1.3 MySQL常見索引和各種索引區別

PRIMARY KEY(主鍵索引)  ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` ) 
UNIQUE(唯一索引)     ALTER TABLE `table_name` ADD UNIQUE (`column`)
INDEX(普通索引)     ALTER TABLE `table_name` ADD INDEX index_name ( `column` ) 
FULLTEXT(全文索引)      ALTER TABLE `table_name` ADD FULLTEXT ( `column` )
組合索引   ALTER TABLE `table_name` ADD INDEX index_name ( `column1`, `column2`, `column3` ) 
  1. 普通索引:最基本的索引,沒有任何限制
  2. 唯一索引:與"普通索引"類似,不同的就是:索引列的值必須唯一,但允許有空值。
  3. 主鍵索引:它 是一種特殊的唯一索引,不允許有空值。
  4. 全文索引:僅可用於 MyISAM 表,針對較大的數據,生成全文索引很耗時好空間。
  5. 組合索引:爲了更多的提高mysql效率可建立組合索引,遵循”最左前綴“原則。

3.2 使用索引好處和索引缺陷

3.2.1 爲什麼要使用索引

    1、索引大大減少了存儲引擎需要掃描的數據量;

    2、索引可以幫助我們進行排序以避免使用臨時表;

    3、索引可以把隨機I/O變爲順序I/O。

3.2.2 索引不是越多越好

    1、索引會增加寫操作的成本;

    2、太多的索引會增加查詢優化器的選擇時間。

索引就好比一本書的目錄,它會讓你更快的找到內容,顯然目錄(索引)並不是越多越好,假如這本書1000頁,而有500頁是目錄,它當然效率低,目錄是要佔紙張的,而索引是要佔磁盤空間的。

3.3 索引優化策略

3.3.1 索引列上不能使用表達式和函數

   

3.3.2 前綴索引和索引列的選擇性

Innodb索引列最大寬度爲 667個字節( utf-8 差不多 255個字符), MyIsam索引類寬度最大爲 1000個字節,於是出現前綴索引,索引的選擇性。

    對於列的值較長,比如BLOB、TEXT、VARCHAR,就必須建立前綴索引,即將值的前一部分作爲索引。這樣既可以節約空間,又可以提高查詢效率。但無法使用前綴索引做 ORDER BYGROUP BY,也無法使用前綴索引做覆蓋掃描。

    語法: ALTER TABLE table_name ADD KEY(column_name(prefix_length))

   

如何選擇索引列的順序:

    1、經常會被使用到的列優先(選擇性差的列不適合,如性別,查詢優化器可能會認爲全表掃描性能更好);

    2、選擇性高的列優先;

    3、寬度小的列優先(一頁中存儲的索引越多,降低I/O,查找越快);

3.3.3 組合/聯合索引策略

    如果索引了多列,要遵守最左前綴法則。指的是查詢從索引的最左前列開始並且不跳過索引中的列
深入理解請移步:最左前綴原理與相關優化

3.3.4 覆蓋索引策略

    跟組合索引有點類似,如果索引包含所有滿足查詢需要的數據的索引則成爲覆蓋索引(Covering Index),也就是平時所說的不需要回表操作。即索引的葉子節點上面包含了他們索引的數據(hash索引不可以)

    判斷標準:使用explain,可以通過輸出的extra列來判斷,對於一個索引覆蓋查詢,顯示爲using index,MySQL查詢優化器在執行查詢前會決定是否有索引覆蓋查詢。

優點:

    1、可以優化緩存,減少磁盤IO操作;
    2、可以減少隨機IO,變隨機IO操作變爲順序IO操作;
    3、可以避免對InnoDB主鍵索引的二次查詢;
    4、可以避免MyISAM表進行系統調用;

無法使用覆蓋索引的情況:

    1、存儲引擎不支持覆蓋索引;
    2、查詢中使用了太多的列(如SELECT * );
    3、使用了雙%號的like查詢(底層API所限制);

    mysql高效索引之覆蓋索引

3.3.5 SQL索引優化總結口訣(套路重點

全值匹配我最愛,最左前綴要遵守;
帶頭大哥不能死,中間兄弟不能斷;
索引列上不計算,範圍之後全失效;
LIKE百分寫最右,覆蓋索引不寫 *;
不等空值還有or,索引失效要少用;
字符單引不可丟,SQL高級也不難 ;

    MySQL高級-索引優化

3.4 使用索引來優化查詢

3.4.1 利用索引排序

    1、group by 實質是先排序後分組,遵照索引的最佳左前綴。;

    2、索引中所有列的方向(升序、降序)和Order By子句完全一致;

    3、當無法使用索引列,增大max_length_for_sort_data參數的設置+增大sort_buffer_size參數的設置;

    4、如果最左列使用了範圍,則排序會失效;

    5、where 高於having,能寫在where限定的條件就不要去having去限定了

3.5 索引的維護和優化

3.5.1 刪除重複索引

   

    注:主鍵約束相當於(唯一約束 + 非空約束)

    一張表中最多有一個主鍵約束,如果設置多個主鍵,就會出現如下提示:Multiple primary key defined!!!

3.5.2 刪除冗餘索引

   

    檢查工具:pt-duplicate-key-checker

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章