原來select語句在MySQL中是這樣執行的！看完又漲見識了！這回我要碾壓面試官！

大家好，我是冰河~~

MySQL作爲互聯網行業使用最多的關係型數據庫之一，與其免費、開源的特性是密不可分的。然而，很多小夥伴工作了很多年，只知道使用MySQL進行CRUD操作，這也導致很多小夥伴工作多年後，想跳槽進入大廠，卻在面試的時候屢屢碰壁。

問個簡單的問題：select語句是如何在MySQL中執行的？ 這也是很多面試官喜歡問的問題，如果你連這個簡單的問題都不能回答的話，那就要好好規劃下自己的職業生涯了。

好了，今天我們就一起來聊聊select語句是如何在MySQL中執行的。文章的主要內容如下。

頻繁使用的select語句

爲了更好地貫穿全文，這裏先來列舉一個最簡單的select查詢語句，例如：查詢user表中id爲1001的用戶信息，使用下面的SQL語句進行查詢。

select * from user where user_id = 1001;

當我們在MySQL的命令行中輸入上述SQL語句時，這條SQL語句到底在MySQL中是如何執行的呢？接下來，我們就以這條SQL語句爲例，說說select語句是如何在MySQL中執行的。

MySQL邏輯架構

在介紹select語句在MySQL中的執行流程之前，我們先來看看MySQL的邏輯架構，因爲任何SQL語句的執行都離不開MySQL邏輯架構的支撐。也就是說，SQL語句在MySQL中的執行流程與MySQL的邏輯架構是密不可分的。

在上圖中，我們簡單的畫了下MySQL的邏輯架構圖，並且給出了邏輯分層和每層中各部分的功能。從邏輯上，我們可以將MySQL粗略地分成三層：Server層、存儲引擎層和系統文件層，而Server層中又可以分成網絡連接層（連接器）和數據服務層（Server層）。

Server層中包含了連接器、查詢緩存、分析器、優化器和執行器等MySQL的核心組成部分，另外，在Server層中還包含了所有的內置函數（比如：日期時間函數、加解密函數、聚合函數、數學函數等），存儲引擎、觸發器、視圖等等。

存儲引擎層主要負責和系統文件層進行交互，存儲引擎層本身是插件式的架構設計，支持InnoDB、MyISAM、Archive、Memory等存儲引擎。在MySQL 5.5.5及以後的版本中，MySQL的默認存儲引擎是InnoDB。

系統文件層主要負責存儲實際的數據，將數據以文件的形式存儲到服務器的磁盤上。

接下來，我們就來說說一條select語句在MySQL的邏輯架構的每一部分到底是如何執行的。

連接器是如何授權的？

首先，我們先來看看在服務器命令行輸入連接MySQL的命令時，MySQL的連接器是如何進行驗證的。比如，我們在服務器的命令行輸入瞭如下命令。

mysql -ubinghe -p

執行“回車”後，輸入binghe賬戶的密碼，與MySQL進行連接。此時，連接的過程需要完成經典的TCP握手操作（有關TCP的握手相關的知識，小夥伴們可以參考《【面經】面試官：講講七層網絡模型與TCP三次握手與四次斷開？》）。之後，連接器就開始認證連接的身份是否合法，最直接的就是驗證用戶名和密碼是否正確。

如果用戶名或者密碼錯誤，MySQL會提示 Access denied for user 。如果用戶名和密碼正確，則連接器會到MySQL的權限表中查詢當前連接擁有的權限。查詢到權限之後，只要這個連接沒有斷開，則這個連接涉及到的權限操作都會依賴此時查詢到的權限。

換句話說，一個用戶登錄MySQL併成功連接MySQL後，哪怕是管理員對當前用戶的權限進行了修改操作，此時只要這個用戶沒有斷開MySQL的連接，就不會受到管理修改權限的影響。管理員修改權限後，只有對新建的連接起作用。

如果客戶端連接MySQL後，長時間沒有執行任何操作，則連接器會自動斷開與這個客戶端的連接。具體多長時間斷開是由MySQL的參數wait_timeout控制的，這個值默認是8小時。我們可以根據實際業務需要，自行調整這個參數的值，以使MySQL能夠滿足我們的實際業務場景。

由於客戶端與MySQL的連接是比較複雜的，這個過程也是比較耗時的，它會涉及TCP的握手操作，還會查詢當前連接的權限信息等。往往在實際的工作過程中，我們會使用數據庫連接池的方式，將數據庫的連接緩存起來，這就意味着我們是使用長連接與MySQL進行交互的。

但是使用長連接連接MySQL也會有一個問題：那就是有時候會發現MySQL佔用的內存漲得特別快，這是因爲MySQL在執行的過程中，使用的臨時內存是在連接對象裏面進行管理的。這些佔用的資源只有在連接斷開的時候，纔會被釋放。如果連接長時間不釋放，就會出現大量的臨時內存佔用內存空間。如果時間久了，可能會導致佔用過多的內存，從而被操作系統“消滅”了，給人的感覺就是MySQL意外重啓了。

我們可以使用如下的方案來解決這個問題：

定期或者執行過一個比較佔內存的查詢操作後，斷開連接，以後再重新建立和MySQL的連接。
如果使用MySQL 5.7或更新的MySQL版本，可以通過執行mysql_reset_connection重新初始化MySQL的資源。重新初始化的過程不會重新連接MySQL，也不會重新做權限的驗證操作。

查詢緩存的作用是什麼？

登錄MySQL後，客戶端就會與MySQL建立連接，此時執行select語句時，首先會到查詢緩存中查詢是否執行過當前select語句。如果之前執行過相應的select語句，則執行過的select語句和查詢結果會以key-value的形式存放在查詢緩存中，其中，key是查詢語句，value是查詢的結果數據。

如果在查詢緩存中沒有找到相應的數據，則會繼續執行後續的查詢階段。執行完成後，會將結果緩存到查詢緩存中。後續的查詢如果命中緩存，則直接返回查詢緩存中的數據，性能還是挺高的。

但是，大多數時候我不太建議小夥伴們開啓查詢緩存，爲啥？原因很簡單：查詢緩存失效的頻率是非常頻繁的，只要對一個表進行更新操作，則這張表上所有的查詢緩存都會被清空。 而且在MySQL 8.0中，直接刪除了查詢緩存的功能（冰河在看MySQL源碼時，也證明了這一點）。

分析器對select語句做了什麼？

分析器主要是對select語句進行 詞法分析和語法分析 操作。

如果select語句沒有命中緩存，則首先會由分析器對其進行“詞法分析”操作，此時，MySQL會識別select語句中的每個字符串代表什麼含義。

例如，MySQL會通過"select"關鍵字識別出這是一個查詢語句，也會把"user"識別爲"數據表名user"，把"id"識別成"字段名id"。接下來，就要進行“語法分析了”，根據語法規則，判斷select語句是否滿足MySQL的語法。如果判斷出輸入的SQL語句不滿足語法規則，則MySQL會提示相應的錯誤信息。

優化器是如何優化select語句的？

對select語句進行了詞法分析和語法分析後，還要經過優化器的優化處理才能執行。比如，我們的select語句中如果使用了多個索引，則優化器會決定使用哪個索引來查詢數據；再比如，在select語句中，有多表關聯的操作，優化器會決定各表的連接順序，數據表的連接順序不同，對於執行的效率會大不相同，優化器往往會選擇使用查詢效率高的連接順序。

如果select語句經過優化器的優化之後，就會進入執行階段了。

執行器如何執行select語句？

進入執行階段的select語句，首先，執行器會對當前連接進行權限檢查，最直接的方式就是檢查當前連接是否對數據表user具有查詢權限。如果當前連接對數據表user沒有查詢權限，就會返回沒有權限的錯誤。例如，會返回如下錯誤。

ERROR 1142 (42000): SELECT command denied to user 'binghe'@'localhost' for table 'user'

如果當前連接具有對數據表user的查詢權限，則會繼續執行。首先會進行打開數據表的操作，此時優化器會根據創建表時使用的存儲引擎，使用相應存儲引擎的接口執行查詢操作。這裏，我們舉一個例子：

假設，我們在id字段上沒有建立索引，執行器執行的流程大致如下所示。

（1）通過存儲引擎讀取數據表user的第一行數據，判斷當前行的id值是否等於1001，如果不等於1001，則繼續讀取下一行數據；如果等於1001，則將當前行放入結果集中。

（2）繼續通過存儲引擎讀取下一行數據，執行與（1）相同的邏輯判斷，直到處理完user表中的所有數據。

（3）處理完所有的數據後，執行器就會將結果集中的數據返回給客戶端。

如果在id字段上有索引的話，執行的整體邏輯與id字段上沒有索引大體一致。

如果開啓了慢查詢的話，執行select語句時，會在慢查詢日誌中輸出一個rows_examined字段，這個字段表示select語句在執行的過程中掃描了數據表中的多少行數據。不過在有些場景下，執行器調用一次，存儲引擎內部會會掃描多行，這就導致存儲引擎掃描的行數與rows_examined字段標識的行數並不完全相同。

好了，今天就到這兒吧，我是冰河，我們下期見~~

原來select語句在MySQL中是這樣執行的！看完又漲見識了！這回我要碾壓面試官！

頻繁使用的select語句

MySQL邏輯架構

連接器是如何授權的？

查詢緩存的作用是什麼？

分析器對select語句做了什麼？

優化器是如何優化select語句的？

執行器如何執行select語句？

互聯網大廠的緩存策略：抵抗超高併發的祕密武器，已開源！

又一個可以寫到簡歷的項目，嘎嘎強！

研發提效必備技能：手把手教你基於Docker搭建Maven私服倉庫

3天面了20個候選人，聊聊我的感受

又一個涵蓋前後端+DevOps+OpenAI大模型的高併發項目啓動了

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結