mysql由於臨時表導致IO過高的性能優化過程分享

線上mysql數據庫爆出一個慢查詢，DBA觀察發現，查詢時服務器IO飆升，IO佔用率達到100%，執行時間長達7s左右。

SQL語句如下：

SELECT DISTINCT g.*, cp.name AS cp_name, c.name AS category_name, t.name AS type_name FROMgm_game g 
LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 
LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 \
LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;

【問題分析】

使用explain查看執行計劃，結果如下：

這條sql語句的問題其實還是比較明顯的：查詢了大量數據(包括數據條數、以及g.* )，然後使用臨時表order by，但最終又只返回了20條數據。

DBA觀察到的IO高，是因爲sql語句生成了一個巨大的臨時表，內存放不下，於是全部拷貝到磁盤，導致IO飆升。

【優化方案】

優化的總體思路是拆分sql，將排序操作和查詢所有信息的操作分開。

第一條語句：查詢符合條件的數據，只需要查詢g.id即可

SELECT DISTINCT g.id FROM gm_game g 
LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 
LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 
LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0
  WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;

第二條語句：查詢符合條件的詳細數據，將第一條sql的結果使用in操作拼接到第二條的sql

SELECT DISTINCT g.*, cp.name AS cp_name,c.name AS category_name,t.name AS type_name FROM gm_game g
 LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 
LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 
LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 
WHERE g.deleted = 0 and g.id in(…………………) ORDER BY g.modify_time DESC ;

【實測效果】

在SATA機器上測試，優化前大約需要50s，優化後第一條0.3s，第二條0.1s，優化後執行速度是原來的100倍以上，IO從100%降到不到1%

在SSD機器上測試，優化前大約需要7s，優化後第一條0.3s，第二條0.1s，優化後執行速度是原來的10倍以上，IO從100%降到不到1%

可以看出，優化前磁盤io是性能瓶頸，SSD的速度要比SATA明顯要快，優化後磁盤不再是瓶頸，SSD和SATA性能沒有差別。

【理論分析】

MySQL在執行SQL查詢時可能會用到臨時表，一般情況下，用到臨時表就意味着性能較低。

臨時表存儲

MySQL臨時表分爲“內存臨時表”和“磁盤臨時表”，其中內存臨時表使用MySQL的MEMORY存儲引擎，磁盤臨時表使用MySQL的MyISAM存儲引擎；

一般情況下，MySQL會先創建內存臨時表，但內存臨時表超過配置指定的值後，MySQL會將內存臨時表導出到磁盤臨時表；

Linux平臺上缺省是/tmp目錄，/tmp目錄小的系統要注意啦。

使用臨時表的場景

ORDER BY子句和GROUP BY子句不同，例如：ORDERY BY price GROUP BY name；
在JOIN查詢中，ORDER BY或者GROUP BY使用了不是第一個表的列例如：SELECT * from TableA, TableB ORDER BY TableA.price GROUP by TableB.name
ORDER BY中使用了DISTINCT關鍵字 ORDERY BY DISTINCT(price)
SELECT語句中指定了SQL_SMALL_RESULT關鍵字 SQL_SMALL_RESULT的意思就是告訴MySQL，結果會很小，請直接使用內存臨時表，不需要使用索引排序 SQL_SMALL_RESULT必須和GROUP BY、DISTINCT或DISTINCTROW一起使用一般情況下，我們沒有必要使用這個選項，讓MySQL服務器選擇即可。

直接使用磁盤臨時表的場景

表包含TEXT或者BLOB列；
GROUP BY 或者 DISTINCT 子句中包含長度大於512字節的列；
使用UNION或者UNION ALL時，SELECT子句中包含大於512字節的列；

臨時表相關配置

tmp_table_size：指定系統創建的內存臨時表最大大小； http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html#sysvar_tmp_table_size

max_heap_table_size: 指定用戶創建的內存表的最大大小； http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html#sysvar_max_heap_table_size

注意：最終的系統創建的內存臨時表大小是取上述兩個配置值的最小值。

表的設計原則

使用臨時表一般都意味着性能比較低，特別是使用磁盤臨時表，性能更慢，因此我們在實際應用中應該儘量避免臨時表的使用。常見的避免臨時表的方法有：

創建索引：在ORDER BY或者GROUP BY的列上創建索引；
分拆很長的列：一般情況下，TEXT、BLOB，大於512字節的字符串，基本上都是爲了顯示信息，而不會用於查詢條件，因此表設計的時候，應該將這些列獨立到另外一張表。

SQL優化

如果表的設計已經確定，修改比較困難，那麼也可以通過優化SQL語句來減少臨時表的大小，以提升SQL執行效率。

常見的優化SQL語句方法如下：

1）拆分SQL語句

臨時表主要是用於排序和分組，很多業務都是要求排序後再取出詳細的分頁數據，這種情況下可以將排序和取出詳細數據拆分成不同的SQL，以降低排序或分組時臨時表的大小，提升排序和分組的效率，我們的案例就是採用這種方法。

2）優化業務，去掉排序分組等操作

有時候業務其實並不需要排序或分組，僅僅是爲了好看或者閱讀方便而進行了排序，例如數據導出、數據查詢等操作，這種情況下去掉排序和分組對業務也沒有多大影響。

如何判斷使用了臨時表？

使用explain查看執行計劃，Extra列看到Using temporary就意味着使用了臨時表。

詳細信息請參考MySQL官方手冊： http://dev.mysql.com/doc/refman/5.1/en/internal-temporary-tables.html

想學習分佈式、微服務、JVM、多線程、架構、java、python的童鞋，千萬不要掃碼，否則後果自負~

林老師帶你學編程：https://wolzq.com

mysql由於臨時表導致IO過高的性能優化過程分享

【問題分析】

【優化方案】

【實測效果】

【理論分析】

源碼揭祕LinkedList removeAll失敗原因

揭祕前端精度丟失之謎！！！

如何用java中的webmagic爬取網頁

如何高效的處理第三方接口數據？

redis分佈式鎖--》死鎖問題解決策略研究

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結