MySQL高性能SQL探索與筆錄

初衷

最近我的大學同學常會拿些SQL語句與我探討如何優化，如何寫出高性能的SQL。在多次交流過後，我覺得儘管我已經工作四年之久但對於SQL語句的性能與優化方面的進步並不是符合我心裏的預期，所以我在週末閒暇之時，來寫這篇文章，一方面是回顧SQL方面的知識，二來是爲了鞏固一些SQL的盲點或是薄弱點，三者也給需要這方面的同行寫寫自己的一些彙總。

環境與數據庫

因爲個人愛好，我的系統是Linux mint19；數據庫版本是MySQL 5.7.23-0ubuntu0.18.04.1 (Ubuntu)。簡單介紹一下查看MySQL版本的方式

# 1.連接服務端，會直接輸出Server版本
ckmike@ckmikePC:~$ mysql -uroot -p
Enter password: 
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 7
Server version: 5.7.23-0ubuntu0.18.04.1 (Ubuntu)

Copyright (c) 2000, 2018, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql>

#2.進入服務器端後使用命令查看
mysql> status
--------------
mysql  Ver 14.14 Distrib 5.7.23, for Linux (x86_64) using  EditLine wrapper

Connection id:      7
Current database:   
Current user:       root@localhost
SSL:            Not in use
Current pager:      stdout
Using outfile:      ''
Using delimiter:    ;
Server version:     5.7.23-0ubuntu0.18.04.1 (Ubuntu)
Protocol version:   10
Connection:     Localhost via UNIX socket
Server characterset:    latin1
Db     characterset:    latin1
Client characterset:    utf8
Conn.  characterset:    utf8
UNIX socket:        /var/run/mysqld/mysqld.sock
Uptime:         2 days 13 hours 58 min 13 sec

Threads: 1  Questions: 53  Slow queries: 0  Opens: 112  Flush tables: 1  Open tables: 104  Queries per second avg: 0.000
--------------

mysql> 

#3.使用系統預定義函數查看
mysql> select version()
    -> ;
+-------------------------+
| version()               |
+-------------------------+
| 5.7.23-0ubuntu0.18.04.1 |
+-------------------------+
1 row in set (0.00 sec)

mysql> 

#4.使用Linux下查看
ckmike@ckmikePC:~$ mysql --version
mysql  Ver 14.14 Distrib 5.7.23, for Linux (x86_64) using  EditLine wrapper

#5.Linux藉助安裝工具查看版本

rpm -qa|grep mysql

當然如果是使用yum安裝的同樣可以用yum查看
yum list installed|grep mysql

備註：SQL是一種標準化的查詢語言，拋開各個數據庫廠商實現的不同，原理上都是相同的，但根據廠商實現的不同，獲取相同結果集會有一些不一樣的寫法，比如說MySQL實現分頁使用的是limit，而oracle是rownum,SQLServer是用在2005版本之前用top,後面使用row_number()。因爲SQL的優化肯定是要針對廠商實現進行，我這裏選MySQL,我使用最多最熟練，其次是oracle，而SQLServer除了在大學用，未曾在工作中使用。MySQL的流行以及爲啥流行就不用我多說了。

數據庫基礎鞏固

在說SQL性能優化之前，我們首先需要先掌握數據庫基礎知識，因爲任何SQL都是跑在數據庫引擎之上的，及好比講解Linux命令和Shell語言一樣，它們都是在某個內核或者某個引擎上的。

數據庫語言分類

根據操作對象和操作粒度的不同，把數據庫語言分爲四大類：

DQL(Data Query Language)

數據庫查詢語言：這個就不用我多說了吧。

DDL（Data Definition Language）

數據庫定義語言：關係模式的定義、修改、刪除。

DML（Data Manipulation Language）

數據庫操作語言：元祖數據的插入、修改、刪除。

DCL（Data Control Language）

數據庫控制語言：權限的授權與回收，事務的回滾與提交等。
不管是MySQL，oracle，還是SQLServer以及其他想PSQL,紅狐狸都是由這些組成的一個產品。就類似安卓系統是一個標準，但安卓系統的各種發現版本各不相同，但核心都是依照安卓系統的標準來的，只是各個發行版本各自實現了一些不一樣的交互效果不一樣的特性，但本質都是一個標準。所以我們瞭解數據庫這套標準是非常重要的，不管產品如何變，但內部核心標準是不會變的，不同的只是因爲實現不同而寫法不一，僅此而已。

說明：對於開發SQL的人來說，她關鍵在於DQL、DDL、DML。而優化也正好是這些部分。

基礎概念

關係：簡單來說就是一張二維表。
元祖：簡單來說就是二維表的一行，也就是一條記錄。
屬性：簡單說就是一個列，代表了一個屬性，比如說：男女（sex）

備註：這是個人簡單的理解，其實專業的定義在我看來是十分拗口的，所以我拷貝那些理論了，但請不清楚的一定要掌握，理解透徹，我的描述可能會誤導你。

集合與代數操作

數學課又要開始了，好，我這裏就不講那些枯燥的數據理論。通俗的講集合就是一類具有共同屬性的元素組成，比如說人是一個集合概念：都有眼睛、鼻子、嘴巴、頭、軀幹、腳等各種器官與組織組成，這是生物上的組成，還有比如說有：性別、姓名、年齡、身高、體重等屬性組成。而一個人就是人這個集合中的一個元素。在結合基礎概念是不是就是集合類似與一張二維表（關係），而具體的人則是一個元祖。

說道集合必然需要提到集合的運算操作：並、差、笛卡爾積、選擇、投影。
延續上面的人這個集合來簡單說並操作：
並運算：比如說中國人=（（北京人）,（天津人）,......(臺灣人),(香港人),(澳門人))等各個省份人的合計。當然在這裏根據定義的不同其實可以包括一些移民的華人，但我這裏是按照國籍，戶籍來分的。就是把所有集合的元素集合在一起就是並運算。

其他操作如果不懂的可以自行補習。篇幅關係不再贅述。

範式

這個概念可能很多人已經不記得了，但只要你涉及數據庫就一定會用到。所以這個的重要性是可想而知的。如果不知道的可到百度數據庫範式進行了解與補習。

DQL

DQL是我們工作中最爲常見，使用最爲頻繁的語言，比如說查看報表。
關鍵字:select

DDL

DDL是關係定義、修改、刪除的語言，包括創建數據庫、表、索引、觸發器、存儲過程、函數。
關鍵字:create

DML

DML是操作元祖的語言，包括元祖的刪除、插入、修改
關鍵字:insert、update、delete

說道這裏很多基礎的知識點我們已經過了一遍，但是像一些分組、函數、排序呀我就不在這裏說了，後面說道了我們再繼續詳細講解。

聚焦SQL優化

上面所寫都不是今天的重點，但確實是非常重要的基礎。SQL性能的優化其實就是針對DQL語句來的，不管你刪除、更新都是要先定位到元祖，所以我們常常說的SQL性能優化其實就是針對查詢語句的部分進行優化的。

那麼影響SQL查詢性能的點有那些呢？我們接下來一個一個羅列。

搜索列加上索引

索引是提升搜索速度最直接最有效的方法，但切忌濫用索引，因爲索引對更新，刪除有負面影響，同時索引也很吃資源。

切忌使用*

我剛接觸數據庫時，我的大學老師（人稱段龍王）就跟我們說：切忌使用select * from這樣的語句,特別是在子查詢中。
我們可以來做個實驗。我現在有一張表user，裏面有大概一百多萬條數據。

# 統計條數，他們都是第一次執行，沒有緩存過
mysql> select count(id) from user;
+-----------+
| count(id) |
+-----------+
|   1050506 |
+-----------+
1 row in set (0.17 sec)

mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
|  1050506 |
+----------+
1 row in set (0.19 sec)

mysql> 

感覺效果不明顯，有時候count(*)還比count(id)更快。我想這個應該跟count()函數有關係，那麼我們直接查詢整個表看看。
mysql>select * from user;
| 1050504 | ckmike699997 |   18 | 17996        | 2019-05-11 |
| 1050505 | ckmike699998 |   18 | 11907        | 2019-05-11 |
| 1050506 | ckmike699999 |   18 | 17726        | 2019-05-11 |
| 1050507 | ckmike700000 |   18 | 1563         | 2019-05-11 |
+---------+--------------+------+--------------+------------+
1050506 rows in set (0.61 sec)
mysql>select name from user;
| ckmike699998 |
| ckmike699999 |
| ckmike700000 |
+--------------+
1050506 rows in set (0.35 sec)

之所以不要使用的原因是耗費資源，在網絡傳送上不必要的字段不用查出來，數據包能多小就多小，這是一個點。但如果在所有自動都要的情況下也儘量不要使用。如果在子查詢中就更是如此了，會成倍成倍的放大消耗時間。這樣的語句一定不要使用!

join（left,inner,right）關聯

通常關聯都是PK\FK進行關聯，所以關聯字段加上索引，且儘量不要使用函數。

where 查詢字段優化

1.查詢字段儘可能加上索引
2.where查詢字段時僅能不適用函數，因爲會使得索引失效，進行全表掃描。
3.where把可以確定更小結果集、可以更快掃選結果集的查詢字段放在前面
4.儘量避免使用like
5.不可在“=”左邊進行函數、算術運算或其他表達式運算，可能無法正確使用索引。
6.儘可能不用!=、<> ，會導致全表掃描
7.如果是一個複合索引的字段，那麼順序要按照索引定義屬性來，否則無法保證索引生效
8.如果使用了變量@這類的會導致索引失效

like切忌使用‘%%’

like '%%'會使得索引失效，從而進行全表掃描，這是非常致命的。而索引的有點完全無法發揮，但卻保留了索引的痛點。那麼是不是就不能使用like呢？當然不是，我們可以使用like 'abdc%',這樣索引的功能生效，又可以使用like,這是一種折中的處理方式，使用like是低效，
但需求有時候是強硬的。

子查詢結果集優先過濾

限制子查詢結果集的大小是非常有效的，儘量把過濾條件放在子查詢中的where語句中，而不是放在外部過濾。

in與exists合理使用

in是使用的是內外表的hash連接，而exists的使用的是loop循環遍歷字表。
那麼這裏就存在一個集合大小影響性能的問題了，如果兩個集合差不多大，其實兩個都差不多，則內表大的用exists，內表小的用in:

表A（小表），表B（大表）1：

select * from A where cc in (select cc from B)
效率低，用到了A 表上cc 列的索引；

select * from A where exists(select cc from B where cc=A.cc)
效率高，用到了B 表上cc 列的索引。

not in 與not exists合理使用

查詢語句使用了not in 那麼內外表都進行全表掃描，沒有用到索引；而not exists 的子查詢依然能用到表上的索引。所以無論那個表大，用not exists 都比not in 要快。

避免使用OR操作符

如果一個字段有索引，一個字段沒有索引，將導致引擎放棄使用索引而進行全表掃描，這個時候我們可以拆分成兩個或者多個結果集進行union。

寫到這裏想到的都寫完了，如果我有寫錯的地方，希望網友留言指出，讓我也進步，也避免誤導其他人。謝謝！

MySQL高性能SQL探索與筆錄

初衷

環境與數據庫

數據庫基礎鞏固

數據庫語言分類

DQL(Data Query Language)

DDL（Data Definition Language）

DML（Data Manipulation Language）

DCL（Data Control Language）

基礎概念

集合與代數操作

範式

DQL

DDL

DML

聚焦SQL優化

搜索列加上索引

切忌使用*

join（left,inner,right）關聯

where 查詢字段優化

like切忌使用‘%%’

子查詢結果集優先過濾

in與exists合理使用

not in 與not exists合理使用

避免使用OR操作符

win11關閉自動檢測病毒刪文件

千兆寬帶實際網速能到達多少？

設計模式-行爲型-職責鏈設計模式

Kafka使用總結與生產消費Demo實現

Linux安裝Zookeeper

Linux下安裝kafka

SpringBoot自動裝配流程源碼分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結