MySQL 性能調優

轉自:https://blog.csdn.net/wireless_com/article/details/52506374

對於全棧而言,數據庫技能不可或缺,關係型數據庫或者nosql,內存型數據庫或者偏磁盤存儲的數據庫,對象存儲的數據庫或者圖數據庫……林林總總,但是第一必備技能還應該是MySQL。從LAMP的興起,到Mariadb的出現,甚至PG的到來,熟練的MySQL技能都是大有用武之地的。

MySQL數據庫技術的方方面面也是很多,這裏只涉及必備的性能調優,推崇從下向上的性能調優,主要包括運行環境,配置參數,SQL性能,和系統架構設計調優。

運行環境調優

這裏是Linux的天下,MySQL 運行環境的調優往往和Linux的內核調優一併完成。當然了,對雲服務RDS 也有一定的參考作用。

調整Linux默認的IO調度算法.

IO調度器的總體目標是希望讓磁頭能夠總是往一個方向移動,移動到底了再往反方向走,這恰恰就是現實生活中的電梯模型,所以IO調度器也被叫做電梯 (elevator),而相應的算法也就被叫做電梯算法.而Linux中IO調度的電梯算法有好幾種,一個叫做as(Anticipatory),一個叫做 cfq(Complete Fairness Queueing),一個叫做deadline,還有一個叫做noop(No Operation).

IO對數據庫的影響較大,linux默認的IO調度算法爲cfq,需要修改爲deadline,如果是SSD或者PCIe-SSD設備,需要修改爲noop,可以使用下面兩種修改方式。

1、在線動態修改,重啓失效。

echo “deadline” > /sys/block/sda/queue/scheduler

2、修改/etc/grub.conf,永久生效。 
修改/etc/grub.conf配置文件,在kernel那行增加一個配置,例如: 
elevator=deadline

主要關注elevator這個參數,設置內核的話需要重啓系統才能生效。

禁用numa特性

新一代架構的NUMA不適合跑數據庫,NUMA是爲了內存利用率的提高,但反而可能導致一CPU的內存尚有剩餘,另外一個卻不夠用了,發生swap的問題,因此一般建議關閉或修改NUMA的調度。

1、修改/etc/grub.conf關閉NUMA,重啓後生效。


numa=off

2、修改/etc/init.d/mysql或mysqld_safe腳本,設置啓動mysqld進程時的NUMA調度機制,如 numactl –interleave=all。

修改swappiness設置

swappiness是linux的一個內核參數,用來控制物理內存交換出去的策略.它允許一個百分比的值,最小的爲0,最大的爲100,改值默認是60.這個設置值到底有什麼影響呢?

vm.swappiness設置爲0表示儘量少使用swap,100表示儘量將inactive的內存頁交換到swap裏或者釋放cache。inactive內存的意思是程序映射着,但是”長時間”不用的內存。我們可以利用vmstat查看系統裏面有多少inactive的內存。

# vmstat -a 1

這個值推薦設置爲1,設置方法如下,在/etc/sysctl.conf文件中增加一行。 
vm.swappiness = 1

擴大文件描述符

這個是經常修改的參數,高併發的程序都會修改.

1、動態修改,重啓失效,只能使用root,並且當前session有效。


ulimit -n 51200

2、修改配置文件,永久生效。 
在/etc/security/limits.conf配置文件中增加

* hard nofile 51200

* soft nofile 51200

面向session的進程文件描述符的修改稍有不同,在雲上的修改也略有差異,可以參見一樣的“open too many files”

優化文件系統掛載參數。

對於文件系統,如無特殊要求,最好採用ext4.

文件系統掛載參數是在/etc/fstab文件中修改,重啓時候生效。 
noatime表示不記錄訪問時間,nodiratime不記錄目錄的訪問時間。 
barrier=0,表示關閉barrier功能.

barrier的主要目的是爲了保證磁盤寫數據的安全性,但是會降低性能。如果有BBU之類的電池備份電源保證控制卡不瞬間掉電,那麼這個功能就可以放心大膽的關閉。

配置參數調優

my.cnf中的配置參數調優取決於業務,負載或硬件,在慢內存和快磁盤、高併發和寫密集型負載情況下,都需要特殊的調整。

基本配置

query_cache_size 
query cache是一個衆所周知的瓶頸,甚至在併發並不多時也如此。 最 好是一開始就停用,設置query_cache_size = 0,並利用其他方法加速查詢:優化索引、增加拷貝分散負載或者啓用額外的緩存(比如memcache或redis)。如果已經啓用了query cache並且還沒有發現任何問題,query cache可能有用。如果想停用它,那就得小心了。

innodb_buffer_pool_size

緩衝池是數據和索引緩存的地方:這個值越大越好,這能保證你在大多數的讀取操作時使用的是內存而不是硬盤。典型的值是5-6GB(8GB內存),20-25GB(32GB內存),100-120GB(128GB內存)。

innodb_log_file_size

redo日誌被用於確保寫操作快速而可靠並且在崩潰時恢復。從MySQL 5.5之後,崩潰恢復的性能的到了很大提升,可以同時擁有較高的寫入性能和崩潰恢復性能。在MySQL 5.6裏可以被提高到4GB以上。如果應用程序需要頻繁的寫入數據,可以一開始就把它這是成4G。

max_connections 
max_connection值被設高了(例如1000或更高)之後一個主要缺陷是當服務器運行1000個或更高的活動事務時會變的沒有響應。在應用程序裏使用連接池或者在MySQL裏使用進程池有助於解決這一問題。

back_log 
要求 mysql 能有的連接數量。當主要mysql線程在一個很短時間內得到非常多的連接請求,這就起作用,然後主線程花些時間檢查連接並且啓動一個新線程。back_log指明在mysql暫時停止回答新請求之前的短時間內多少個請求可以被存在堆棧中。只有如果期望在一個短時間內有很多連接,需要增加它,換句話說,該值對到來的tcp/ip連接的偵聽隊列的大小。

Innodb配置

innodb_file_per_table

這項設置告知InnoDB是否需要將所有表的數據和索引存放在共享表空間裏(innodb_file_per_table = OFF)或者爲每張表的數據單獨放在一個.ibd文件(innodb_file_per_table = ON)。每張表一個文件允許你在drop、truncate或者rebuild表時回收磁盤空間。這對於一些高級特性也是有必要的,比如數據壓縮。但是它不會帶來任何性能收益。MySQL 5.6中,這個屬性默認值是ON。

innodb_flush_log_at_trx_commit

默認值爲1,表示InnoDB完全支持ACID特性。當關注點是數據安全的時候這個值是最合適的,比如在一個主節點上。但是對於磁盤(讀寫)速度較慢的系統,它會帶來很巨大的開銷,因爲每次將改變flush到redo日誌都需要額外的fsyncs。如果值爲0速度就更快了,但在系統崩潰時可能丟失一些數據, 所以一遍只適用於備份節點。

innodb_flush_method

這項配置決定了數據和日誌寫入硬盤的方式。一般來說,如果你有硬件RAID控制器,並且其獨立緩存採用write-back機制,並有着電池斷電保護,那麼應該設置配置爲O_DIRECT;否則,大多數情況下應將其設爲fdatasync(默認值)。sysbench是一個可以幫助你決定這個選項的好工具。

innodb_log_buffer_size

這項配置決定了爲尚未執行的事務分配的緩存。但是如果事務中包含有二進制大對象或者大文本字段的話,看Innodb_log_waits狀態變量,如果它不是0,增加innodb_log_buffer_size。

其他配置

log_bin

如果數據庫服務器充當主節點的備份節點,那麼開啓二進制日誌是必須的。就算只有一個服務器,如果你想做基於時間點的數據恢復,這也是很有用的。二進制日誌一旦創建就將永久保存。如果不想讓磁盤空間耗盡,你可以用 PURGE BINARY LOGS 來清除舊文件,或者設置 expire_logs_days 來指定過多少天日誌將被自動清除。記錄二進制日誌不是沒有開銷的,所以如果你在一個非主節點的複製節點上不需要它的話,那麼建議關閉這個選項。

interactive_timeout

服務器在關閉它前在一個交互連接上等待行動的秒數。一個交互的客戶被定義爲對 mysql_real_connect()使用 client_interactive 選項的客戶。 默認數值是28800,建議改爲7200。

table_open_cache

MySQL每打開一個表,都會讀入一些數據到table_open_cache緩存中,當MySQL在這個緩存中找不到相應信息時,纔會去磁盤上讀取。假定系統有200個併發連接,則需將此參數設置爲200*N(N爲每個連接所需的文件描述符數目);當把table_open_cache設置爲很大時,如果系統處理不了那麼多文件描述符,那麼就會出現客戶端失效,連接不上。

max_allowed_packet

接受的數據包大小;增加該變量的值十分安全,這是因爲僅當需要時纔會分配額外內存。例如,僅當你發出長查詢或MySQLd必須返回大的結果行時MySQLd纔會分配更多內存。該變量之所以取較小默認值是一種預防措施,以捕獲客戶端和服務器之間的錯誤信息包,並確保不會因偶然使用大的信息包而導致內存溢出 
skip_name_resolve

當客戶端連接數據庫服務器時,且當DNS很慢時,建立連接也會很慢。因此建議在啓動服務器時關閉skip_name_resolve選項而不進行DNS查找。

SQL 語句調優

在應用層,通過pt工具和慢查詢日誌的配合,可以輕鬆地分辨出全表掃描的語句。

基本原則

避免全表掃描
建立索引
儘量避免向客戶端返回大數據量,若數據量過大,應該考慮相應需求是否合理
儘量避免大事務操作,提高系統併發能力
使用基於遊標的方法或臨時表方法之前,應先尋找基於集的解決方案來解決問題,基於集的方法通常更有效。儘量避免使用遊標,因爲遊標的效率較差。
雕蟲小技

關於where 後的條件

應儘量避免在 where 子句中使用 != 或 <> 操作符,否則將引擎放棄使用索引而進行全表掃描。
應儘量避免在 where 子句中使用 or 來連接條件,可以考慮使用union 代替
in 和 not in 也要慎用,對於連續的數值,能用 between 就不要用 in,exists 代替 in
儘量避免在 where 子句中對字段進行表達式操作和函數操作
關於數據類型

儘量使用數字型字段,若只含數值信息的字段儘量不要設計爲字符型,這會降低查詢和連接的性能,並會增加存儲開銷。

儘可能的使用 varchar/nvarchar 代替 char/nchar ,因爲變長字段存儲空間小,對於查詢來說,在一個相對較小的字段內搜索效率顯然要高些。

最好不要給數據庫留NULL,儘可能的使用 NOT NULL填充數據庫.備註、描述、評論之類的可以設置爲 NULL,其他的,最好不要使用NULL。

任何地方都不要使用 select * from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。

關於臨時表

避免頻繁創建和刪除臨時表,以減少系統表資源的消耗。對於一次性事件, 最好使用導出表。

在新建臨時表時,如果一次性插入數據量很大,那麼可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數據量不大,爲了緩和系統表的資源,應先create table,然後insert。

如果使用到了臨時表,在最後將所有的臨時表顯式刪除時,先 truncate table ,然後 drop table ,這樣可以避免系統表的較長時間鎖定。
關於索引

先應考慮在 where 及 order by 涉及的列上建立索引。
在使用索引字段作爲條件時,如果該索引是複合索引,那麼必須使用到該索引中的第一個字段作爲條件 時才能保證系統使用該索引, 否則該索引將不會 被使用, 並且應儘可能的讓字段順序與索引順序相一致。
索引並不是越多越好,索引固然可以提高相應的 select 的效率,但同時也降低了 insert和update 的效率,因爲 insert 或 update 時有可能會重建索引,所以視具體情況而定。一個表的索引數最好不要超過7個,若太多則應考慮一些不常使用到的列上建的索引是否有必要.
數據庫架構調優

從底層來到了應用層,最終到架構層,然而脫離業務邏輯談架構就是耍流氓。數據庫架構同樣是依賴業務系統的,穩定而又彈性地服務業務系統是關鍵。架構調優的方向有:

分區分表
業務分庫
主從同步與讀寫分離
數據緩存
主從熱備與HA雙活
…..
--------------------- 
作者:半吊子全棧工匠 
來源:CSDN 
原文:https://blog.csdn.net/wireless_com/article/details/52506374 
版權聲明:本文爲博主原創文章,轉載請附上博文鏈接!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章