MYSQL分表優化

原創

2020-06-30 02:36

我們的項目中有好多不等於的情況。今天寫這篇文章簡單的分析一下怎麼個優化法。
這裏的分表邏輯是根據t_group表的user_name組的個數來分的。
因爲這種情況單獨user_name字段上的索引就屬於爛索引。起不了啥名明顯的效果。

1、試驗PROCEDURE.
DELIMITER $$
DROP PROCEDURE `t_girl`.`sp_split_table`$$
CREATE PROCEDURE `t_girl`.`sp_split_table`()
BEGIN
declare done int default 0;
declare v_user_name varchar(20) default '';
declare v_table_name varchar(64) default '';
-- Get all users' name.
declare cur1 cursor for select user_name from t_group group by user_name;
-- Deal with error or warnings.
declare continue handler for 1329 set done = 1;
-- Open cursor.
open cur1;
while done <> 1
do
    fetch cur1 into v_user_name;
    if not done then
      -- Get table name.
      set v_table_name = concat('t_group_',v_user_name);
      -- Create new extra table.
      set @stmt = concat('create table ',v_table_name,' like t_group');
      prepare s1 from @stmt;
      execute s1;
      drop prepare s1;
      -- Load data into it.
      set @stmt = concat('insert into ',v_table_name,' select * from t_group where user_name = ''',v_user_name,'''');
      prepare s1 from @stmt;
      execute s1;
      drop prepare s1;
    end if;
end while;
-- Close cursor.
close cur1;
-- Free variable from memory.
set @stmt = NULL;
END$$

DELIMITER ;
2、試驗表。
我們用一個有一千萬條記錄的表來做測試。

mysql> select count(*) from t_group;
+----------+
| count(*) |
+----------+
| 10388608 |
+----------+
1 row in set (0.00 sec)

表結構。
mysql> desc t_group;
+-------------+------------------+------+-----+-------------------+----------------+
| Field       | Type             | Null | Key | Default           | Extra          |
+-------------+------------------+------+-----+-------------------+----------------+
| id          | int(10) unsigned | NO   | PRI | NULL              | auto_increment |
| money       | decimal(10,2)    | NO   |     |                   |                |
| user_name   | varchar(20)      | NO   | MUL |                   |                |
| create_time | timestamp        | NO   |     | CURRENT_TIMESTAMP |                |
+-------------+------------------+------+-----+-------------------+----------------+
4 rows in set (0.00 sec)

索引情況。

mysql> show index from t_group;
+---------+------------+------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| Table   | Non_unique | Key_name         | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |
+---------+------------+------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| t_group |          0 | PRIMARY          |            1 | id          | A         |    10388608 |     NULL | NULL   |      | BTREE      |         |
| t_group |          1 | idx_user_name    |            1 | user_name   | A         |           8 |     NULL | NULL   |      | BTREE      |         |
| t_group |          1 | idx_combination1 |            1 | user_name   | A         |           8 |     NULL | NULL   |      | BTREE      |         |
| t_group |          1 | idx_combination1 |            2 | money       | A         |        3776 |     NULL | NULL   |      | BTREE      |         |
+---------+------------+------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
4 rows in set (0.00 sec)

PS:
idx_combination1 這個索引是必須的，因爲要對user_name來GROUP BY。此時屬於鬆散索引掃描！當然完了後你可以幹掉她。
idx_user_name 這個索引是爲了加快單獨執行constant這種類型的查詢。
我們要根據用戶名來分表。

mysql> select user_name from t_group where 1 group by user_name;
+-----------+
| user_name |
+-----------+
| david     |
| leo       |
| livia     |
| lucy      |
| sarah     |
| simon     |
| sony      |
| sunny     |
+-----------+
8 rows in set (0.00 sec)

所以結果表應該是這樣的。
mysql> show tables like 't_group_%';
+------------------------------+
| Tables_in_t_girl (t_group_%) |
+------------------------------+
| t_group_david                |
| t_group_leo                  |
| t_group_livia                |
| t_group_lucy                 |
| t_group_sarah                |
| t_group_simon                |
| t_group_sony                 |
| t_group_sunny                |
+------------------------------+
8 rows in set (0.00 sec)

3、對比結果。

mysql> select count(*) from t_group where user_name = 'david';
+----------+
| count(*) |
+----------+
| 1298576 |
+----------+
1 row in set (1.71 sec)

執行了將近2秒。

mysql> select count(*) from t_group_david;
+----------+
| count(*) |
+----------+
| 1298576 |
+----------+
1 row in set (0.00 sec)
幾乎是瞬間的。

mysql> select count(*) from t_group where user_name <> 'david';
+----------+
| count(*) |
+----------+
| 9090032 |
+----------+
1 row in set (9.26 sec)
執行了將近10秒，可以想象，這個是實際的項目中是不能忍受的。
mysql> select (select count(*) from t_group) - (select count(*) from t_group_david) as total;
+---------+
| total   |
+---------+
| 9090032 |
+---------+
1 row in set (0.00 sec)
幾乎是瞬間的。

我們來看看聚集函數。
對於原表的操作。

mysql> select min(money),max(money) from t_group where user_name = 'david';
+------------+------------+
| min(money) | max(money) |
+------------+------------+
|      -6.41 |     500.59 |
+------------+------------+
1 row in set (0.00 sec)
最小，最大值都是FULL INDEX SCAN。所以是瞬間的。
mysql> select sum(money),avg(money) from t_group where user_name = 'david';
+--------------+------------+
| sum(money)   | avg(money) |
+--------------+------------+
| 319992383.84 | 246.417910 |
+--------------+------------+
1 row in set (2.15 sec)
其他聚集函數的結果就不是FULL INDEX SCAN了。耗時2.15秒。

對於小表的操作。
mysql> select min(money),max(money) from t_group_david;
+------------+------------+
| min(money) | max(money) |
+------------+------------+
|      -6.41 |     500.59 |
+------------+------------+
1 row in set (1.50 sec)
最大最小值完全是FULL TABLE SCAN,耗時1.50秒，不划算。以此看來。
mysql> select sum(money),avg(money) from t_group_david;
+--------------+------------+
| sum(money)   | avg(money) |
+--------------+------------+
| 319992383.84 | 246.417910 |
+--------------+------------+
1 row in set (1.68 sec)

取得這兩個結果也是花了快2秒，快了一點。

我們來看看這個小表的結構。
mysql> desc t_group_david;
+-------------+------------------+------+-----+-------------------+----------------+
| Field       | Type             | Null | Key | Default           | Extra          |
+-------------+------------------+------+-----+-------------------+----------------+
| id          | int(10) unsigned | NO   | PRI | NULL              | auto_increment |
| money       | decimal(10,2)    | NO   |     |                   |                |
| user_name   | varchar(20)      | NO   | MUL |                   |                |
| create_time | timestamp        | NO   |     | CURRENT_TIMESTAMP |                |
+-------------+------------------+------+-----+-------------------+----------------+
4 rows in set (0.00 sec)

明顯的user_name屬性是多餘的。那麼就幹掉它。
mysql> alter table t_group_david drop user_name;
Query OK, 1298576 rows affected (7.58 sec)
Records: 1298576 Duplicates: 0 Warnings: 0

現在來重新對小表運行查詢

mysql> select min(money),max(money) from t_group_david;
+------------+------------+
| min(money) | max(money) |
+------------+------------+
|      -6.41 |     500.59 |
+------------+------------+
1 row in set (0.00 sec)

此時是瞬間的。
mysql> select sum(money),avg(money) from t_group_david;
+--------------+------------+
| sum(money)   | avg(money) |
+--------------+------------+
| 319992383.84 | 246.417910 |
+--------------+------------+
1 row in set (0.94 sec)

這次算是控制在一秒以內了。

mysql> Aborted

小總結一下：分出的小表的屬性儘量越少越好。大膽的去幹吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

mysql存量表數據碎片與索引碎片優化

背景最近領導分配了個任務，測試sit環境一些功能相比之前慢了許多，需要優化一下。問題排查過程瀏覽器F12查看相關接口的響應，看到底是哪個接口反應慢，根據互聯網的要求，頁面3秒還沒有顯示出來，用戶體驗會非常差。查看相關代碼的提交

2024-05-13 21:34:00

多點 Dmall x TiDB：出海多雲多活架構下的 TiDB 運維實戰

作者：多點，唐萬民導讀時隔 2 年，在 TiDB 社區成都地區組織者馮光普老師的協助下，TiDB 社區線下地區活動再次來到成都。來自多點 Dmall 的國內數據庫負責人唐萬民老師，在《出海多雲架構，多點 TiDB 運維實戰》的主題分享

2024-05-15 10:48:37

詳解 MySQL 的 binlog 時間戳與 exec_time 的關係

詳解 binlog 時間戳與 exec_time 的關係。作者：李錫超，蘇商銀行DBA，負責數據庫和中間件運維和建設。擅長 MySQL、Python、Oracle，愛好騎行、技術研究和分享。愛可生開源社區出品，原創內容未經授權不得隨意

2024-05-15 00:02:08

播放全鏈路壓測實踐之路

01 背景播放鏈路是愛奇藝最重要的業務，鏈路穩定性極其重要，隨着愛奇藝用戶的不斷增長和熱播劇集的推廣，播放鏈路往往面臨着難以預估的用戶流量的突增，考

愛奇藝技術產品團隊

2024-05-14 02:28:30

安裝Mysql時遇到的一些疑難雜症！！！

安裝MYSQL時的一系列三大問題與三大解決方法問題一：問題二：問題三：問題一：在安裝時候輸入 net start mysql 時候報錯爲： net不是內部或外部命令也不是可運行。解決方法：環境變量的問題

2024-05-14 02:04:37

TOP SQL監控之MySQL篇

MySQL的監控方式也有很多種：慢查詢日誌slow_log 優點：MySQL自帶，記錄的慢SQL語句完整；缺點：需要登錄mysql服務器；如果slow_log文件太大，還需要利用其他工具分析日誌，比如mysqldumpslow； p

2024-05-14 01:47:36

binlog的刷盤策略

mysql只有在事務提交的時候纔會記錄binlog日誌，此時日誌還在內存中，那binlog是什麼時候被刷到磁盤中的呢？ mysql通過sync_binlog控制刷盤，取值範圍0~n 0：不強制要求刷盤，由系統自行判斷什麼時候將binlog寫

2024-05-14 00:46:36

14 hive安裝

1.hive 1.1 解壓 tar -zxf apache-hive-1.2.2-bin.tar.gz -C .. mv apache-hive-1.2.2-bin/ hive-1.2.2 1.2 修改配置

2024-05-14 00:41:14

樹莓派真是個讓人慾罷不能的“小妖精”

大晚上不睡覺、枸杞泡起來@我一個月之前、自從入了樹莓派4b 8g板之後、就無法自拔，上班除了開發業務代碼和搭建內部UI組件庫之外，就是不亦樂乎的學習docker、mysql、mongodb、php、python、frp等，採購了阿里雲E

2024-05-14 00:37:28

分析 MySQL 中的內存使用情況

瞭解如何可視化 MySQL 連接的內存使用情況。作者：Benjamin Dicken 本文和封面來源：https://planetscale.com/blog/，愛可生開源社區翻譯。本文約 3000 字，預計閱讀需要 10 分鐘。

2024-05-14 00:04:20

消費者太多！RocketMQ又炸了！

去年寫過一篇《Topic數量太多！RocketMQ炸了！》，大家評價還不錯。結果，2024年的開頭，我們的RocketMQ又炸了！ 1、問題現象先說明下RocketMQ版本， 4.6.0的老版本了。線下環境客戶端啓動會頻

2024-05-13 12:34:50

PingCAP 戴濤：構建面向未來的金融核心系統

作者：戴濤導讀近日，平凱星辰解決方案技術部總經理戴濤在 2024 數據技術嘉年華活動中，做了主題爲“構建面向未來的金融核心系統”的分享，本文爲戴濤演講實錄的全文。文章分析了中國金融行業的發展趨勢，並且基於這些趨勢對數據庫選擇從架構、運

2024-05-13 11:16:37

TiDB + ES：轉轉業財系統億級數據存儲優化實踐

以下文章來源於轉轉技術，作者戴美琪導讀本文詳細介紹了轉轉業財系統億級數據存儲優化的實踐。面對系統數據量大、慢查詢多等挑戰，轉轉業財採取了 TiDB 方案優化數據量問題，同時引入 Elasticsearch（ES）解決慢查詢難題。實踐表

2024-05-13 11:16:34

[CSS]CSS浮動塌陷及解決辦法

一. CSS浮動先看一個例子 <html !DOCTYPE> <head> <title>HTML2</title> <style> .div-outer {

2024-05-13 23:37:32

瞭解GaussDB SQL中CASE表達式

本文分享自華爲雲社區《GaussDB SQL基本語法示例-CASE表達式》，作者：Gauss松鼠會小助手2。一、前言 SQL是用於訪問和處理數據庫的標準計算機語言。GaussDB支持SQL標準（默認支持SQL2、SQL3和SQL4的主要

2024-05-13 11:31:23

24小時熱門文章

最新文章

最新評論文章