原來select語句在MySQL中是這樣執行的!看完又漲見識了!這回我要碾壓面試官!

大家好,我是冰河~~

MySQL作爲互聯網行業使用最多的關係型數據庫之一,與其免費、開源的特性是密不可分的。然而,很多小夥伴工作了很多年,只知道使用MySQL進行CRUD操作,這也導致很多小夥伴工作多年後,想跳槽進入大廠,卻在面試的時候屢屢碰壁。

問個簡單的問題:select語句是如何在MySQL中執行的? 這也是很多面試官喜歡問的問題,如果你連這個簡單的問題都不能回答的話,那就要好好規劃下自己的職業生涯了。

好了,今天我們就一起來聊聊select語句是如何在MySQL中執行的。文章的主要內容如下。

頻繁使用的select語句

爲了更好地貫穿全文,這裏先來列舉一個最簡單的select查詢語句,例如:查詢user表中id爲1001的用戶信息,使用下面的SQL語句進行查詢。

select * from user where user_id = 1001;

當我們在MySQL的命令行中輸入上述SQL語句時,這條SQL語句到底在MySQL中是如何執行的呢?接下來,我們就以這條SQL語句爲例,說說select語句是如何在MySQL中執行的。

MySQL邏輯架構

在介紹select語句在MySQL中的執行流程之前,我們先來看看MySQL的邏輯架構,因爲任何SQL語句的執行都離不開MySQL邏輯架構的支撐。也就是說,SQL語句在MySQL中的執行流程與MySQL的邏輯架構是密不可分的。

在上圖中,我們簡單的畫了下MySQL的邏輯架構圖,並且給出了邏輯分層和每層中各部分的功能。從邏輯上,我們可以將MySQL粗略地分成三層:Server層、存儲引擎層和系統文件層,而Server層中又可以分成網絡連接層(連接器)和數據服務層(Server層)。

Server層中包含了連接器、查詢緩存、分析器、優化器和執行器等MySQL的核心組成部分,另外,在Server層中還包含了所有的內置函數(比如:日期時間函數、加解密函數、聚合函數、數學函數等),存儲引擎、觸發器、視圖等等。

存儲引擎層主要負責和系統文件層進行交互,存儲引擎層本身是插件式的架構設計,支持InnoDB、MyISAM、Archive、Memory等存儲引擎。在MySQL 5.5.5及以後的版本中,MySQL的默認存儲引擎是InnoDB。

系統文件層主要負責存儲實際的數據,將數據以文件的形式存儲到服務器的磁盤上。

接下來,我們就來說說一條select語句在MySQL的邏輯架構的每一部分到底是如何執行的。

連接器是如何授權的?

首先,我們先來看看在服務器命令行輸入連接MySQL的命令時,MySQL的連接器是如何進行驗證的。比如,我們在服務器的命令行輸入瞭如下命令。

mysql -ubinghe -p

執行“回車”後,輸入binghe賬戶的密碼,與MySQL進行連接。此時,連接的過程需要完成經典的TCP握手操作(有關TCP的握手相關的知識,小夥伴們可以參考《【面經】面試官:講講七層網絡模型與TCP三次握手與四次斷開?》)。之後,連接器就開始認證連接的身份是否合法,最直接的就是驗證用戶名和密碼是否正確。

如果用戶名或者密碼錯誤,MySQL會提示 Access denied for user 。如果用戶名和密碼正確,則連接器會到MySQL的權限表中查詢當前連接擁有的權限。查詢到權限之後,只要這個連接沒有斷開,則這個連接涉及到的權限操作都會依賴此時查詢到的權限。

換句話說,一個用戶登錄MySQL併成功連接MySQL後,哪怕是管理員對當前用戶的權限進行了修改操作,此時只要這個用戶沒有斷開MySQL的連接,就不會受到管理修改權限的影響。管理員修改權限後,只有對新建的連接起作用。

如果客戶端連接MySQL後,長時間沒有執行任何操作,則連接器會自動斷開與這個客戶端的連接。具體多長時間斷開是由MySQL的參數wait_timeout控制的,這個值默認是8小時。我們可以根據實際業務需要,自行調整這個參數的值,以使MySQL能夠滿足我們的實際業務場景。

由於客戶端與MySQL的連接是比較複雜的,這個過程也是比較耗時的,它會涉及TCP的握手操作,還會查詢當前連接的權限信息等。往往在實際的工作過程中,我們會使用數據庫連接池的方式,將數據庫的連接緩存起來,這就意味着我們是使用長連接與MySQL進行交互的。

但是使用長連接連接MySQL也會有一個問題:那就是有時候會發現MySQL佔用的內存漲得特別快,這是因爲MySQL在執行的過程中,使用的臨時內存是在連接對象裏面進行管理的。這些佔用的資源只有在連接斷開的時候,纔會被釋放。如果連接長時間不釋放,就會出現大量的臨時內存佔用內存空間。如果時間久了,可能會導致佔用過多的內存,從而被操作系統“消滅”了,給人的感覺就是MySQL意外重啓了。

我們可以使用如下的方案來解決這個問題:

  • 定期或者執行過一個比較佔內存的查詢操作後,斷開連接,以後再重新建立和MySQL的連接。
  • 如果使用MySQL 5.7或更新的MySQL版本,可以通過執行mysql_reset_connection重新初始化MySQL的資源。重新初始化的過程不會重新連接MySQL,也不會重新做權限的驗證操作。

查詢緩存的作用是什麼?

登錄MySQL後,客戶端就會與MySQL建立連接,此時執行select語句時,首先會到查詢緩存中查詢是否執行過當前select語句。如果之前執行過相應的select語句,則執行過的select語句和查詢結果會以key-value的形式存放在查詢緩存中,其中,key是查詢語句,value是查詢的結果數據。

如果在查詢緩存中沒有找到相應的數據,則會繼續執行後續的查詢階段。執行完成後,會將結果緩存到查詢緩存中。後續的查詢如果命中緩存,則直接返回查詢緩存中的數據,性能還是挺高的。

但是,大多數時候我不太建議小夥伴們開啓查詢緩存,爲啥?原因很簡單:查詢緩存失效的頻率是非常頻繁的,只要對一個表進行更新操作,則這張表上所有的查詢緩存都會被清空。 而且在MySQL 8.0中,直接刪除了查詢緩存的功能(冰河在看MySQL源碼時,也證明了這一點)。

分析器對select語句做了什麼?

分析器主要是對select語句進行 詞法分析和語法分析 操作。

如果select語句沒有命中緩存,則首先會由分析器對其進行“詞法分析”操作,此時,MySQL會識別select語句中的每個字符串代表什麼含義。

例如,MySQL會通過"select"關鍵字識別出這是一個查詢語句,也會把"user"識別爲"數據表名user",把"id"識別成"字段名id"。接下來,就要進行“語法分析了”,根據語法規則,判斷select語句是否滿足MySQL的語法。如果判斷出輸入的SQL語句不滿足語法規則,則MySQL會提示相應的錯誤信息。

優化器是如何優化select語句的?

對select語句進行了詞法分析和語法分析後,還要經過優化器的優化處理才能執行。比如,我們的select語句中如果使用了多個索引,則優化器會決定使用哪個索引來查詢數據;再比如,在select語句中,有多表關聯的操作,優化器會決定各表的連接順序,數據表的連接順序不同,對於執行的效率會大不相同,優化器往往會選擇使用查詢效率高的連接順序。

如果select語句經過優化器的優化之後,就會進入執行階段了。

執行器如何執行select語句?

進入執行階段的select語句,首先,執行器會對當前連接進行權限檢查,最直接的方式就是檢查當前連接是否對數據表user具有查詢權限。如果當前連接對數據表user沒有查詢權限,就會返回沒有權限的錯誤。例如,會返回如下錯誤。

ERROR 1142 (42000): SELECT command denied to user 'binghe'@'localhost' for table 'user'

如果當前連接具有對數據表user的查詢權限,則會繼續執行。首先會進行打開數據表的操作,此時優化器會根據創建表時使用的存儲引擎,使用相應存儲引擎的接口執行查詢操作。這裏,我們舉一個例子:

假設,我們在id字段上沒有建立索引,執行器執行的流程大致如下所示。

(1)通過存儲引擎讀取數據表user的第一行數據,判斷當前行的id值是否等於1001,如果不等於1001,則繼續讀取下一行數據;如果等於1001,則將當前行放入結果集中。

(2)繼續通過存儲引擎讀取下一行數據,執行與(1)相同的邏輯判斷,直到處理完user表中的所有數據。

(3)處理完所有的數據後,執行器就會將結果集中的數據返回給客戶端。

如果在id字段上有索引的話,執行的整體邏輯與id字段上沒有索引大體一致。

如果開啓了慢查詢的話,執行select語句時,會在慢查詢日誌中輸出一個rows_examined字段,這個字段表示select語句在執行的過程中掃描了數據表中的多少行數據。不過在有些場景下,執行器調用一次,存儲引擎內部會會掃描多行,這就導致存儲引擎掃描的行數與rows_examined字段標識的行數並不完全相同。

好了,今天就到這兒吧,我是冰河,我們下期見~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章