MYSQL實戰四十五講總結筆記_01、SQL查詢語句如何執行

前言:整理歸納,個人溫習之用,請支持正版極客時間

1、MYSQL的基本架構

如上圖所示,MYSQL可以分爲Server層存儲引擎層。不同的存儲引擎共用一個Server層。
Server層:連接器、查詢緩存、分析器、優化器、執行器、執行器,包含MYSQL的大多數核心服務功能和所有內置函數(日期、時間、數學、加密函數),
所有跨存儲引擎的功能都在這一層實現,比如存儲過程、觸發器、視圖等。
存儲引擎層:負責數據的存儲和提取。插件式架構模式,支持InnoDB(MYSQL5.5.5開始成爲默認存儲引擎)、MyISAM、Memory等多個存儲引擎。
 

2、連接器

*連接器:負責跟客戶端建立連接、獲取權限、維持和管理連接。
              客戶端命令:mysql -h$ip -P$port -u$user -p
              如果是生產服務器,不建議直接在-p後面寫密碼,可能導致密碼泄露
 
*身份權限驗證:在完成經典的 TCP 握手後,連接器就要開始認證你的身份,輸入你的用戶名和密碼。
                         如果用戶名或密碼不對,你就會收到一個"Access denied for user"的錯誤,然後客戶端程序結束執行。
                         如果用戶名密碼認證通過,連接器會到權限表裏面查出你擁有的權限。這個連接裏面的權限判斷邏輯,都將依賴於此時讀到的權限。
                         Ps:一個用戶成功建立連接後,即使你用管理員賬號對這個用戶的權限做了修改,也不會影響已經存在連接的權限。修改完成後,只有再新建的連接纔會使用新的權限設置。
 
*在命令行輸入show processlist,可查看連接的狀態,其中 Command 列顯示爲“Sleep”的這一行,就表示現在系統裏面有一個空閒連接。
 
*客戶端超過8小時(參數wait_timeout設置)沒動靜,連接器就會自動斷開連接,此時再發送請求,就會收到錯誤提示“Lost connection to MySQL server during query”,需要重連再執行請求。
 
*長連接:連接成功後,如果客戶端持續有請求,則一直使用同一個連接。短連接:每次執行完很少的幾次查詢就斷開連接,下次查詢再重新建立一個。
               因爲建立連接過程複雜,建議使用長連接,但是MySQL 在執行過程中臨時使用的內存是管理在連接對象裏面的,這些資源會在連接斷開的時候才釋放。所以如果                  長連接累積下來,可能導致內存佔用太大,被系統強行殺掉(OOM),MySQL 異常重啓。
               解決方案:(1)、定期斷開長連接。使用一段時間,或者程序裏面判斷執行過一個佔用內存的大查詢後,斷開連接,之後要查詢再重連。
                                (2)、如果你用的是 MySQL 5.7 或更新版本,可以在每次執行一個比較大的操作後,通過執行 mysql_reset_connection 來重新初始化連接資源。這                                               個過程不需要重連和重新做權限驗證,但是會將連接恢復到剛剛創建完時的狀態。
 

3、查詢緩存

*運行邏輯:MySQL 拿到查詢請求後,會先到查詢緩存看看,之前是不是執行過這條語句。之前執行過的語句及其結果可能會以 key-value 對的形式,被直接緩存在內存中。key 是查詢的語句,value 是查詢的結果。如果你的查詢能夠直接在這個緩存中找到 key,那麼這個 value 就會被直接返回給客戶端。如果語句不在查詢緩存中,就會繼續後面的執行階段。執行完成後,執行結果會被存入查詢緩存中。你可以看到,如果查詢命中緩存,MySQL 不需要執行後面的複雜操作,就可以直接返回結果,這個效率會很高。
 
*查詢緩存弊大於利,查詢緩存的失效非常頻繁,只要有對一個表的更新,這個表上所有的查詢緩存都會被清空。對於更新壓力大的數據庫來說,查詢緩存的命中率會非常低。除非你的業務就是有一張靜態表,很長時間纔會更新一次。比如,一個系統配置表,那這張表上的查詢才適合使用查詢緩存。
 
*按需使用查詢緩存:將參數 query_cache_type 設置成 DEMAND,這樣對於默認的 SQL 語句都不使用查詢緩存。對於確定要使用查詢緩存的語句,可以用 SQL_CACHE 顯式指定,如
select SQL_CACHE * from T where ID=10;

Ps:MySQL 8.0 版本開始沒有這個功能。

 

4、分析器(做什麼)

*首先,詞法分析:MySQL 需要識別出你輸入的字符串分別是什麼,代表什麼。例:MySQL 從你輸入的"select"這個關鍵字識別出來,這是一個查詢語句。它也要把字符串“T”識別成“表名 T”,把字符串“ID”識別成“列 ID”。
 
*其次,語法分析:根據語法規則,判斷你輸入的這個 SQL 語句是否滿足 MySQL 語法。如果你的語句不對,就會收到“You have an error in your SQL syntax”的錯誤提醒,比如下面這個語句 select 少打了開頭的字母“s”
mysql> elect * from t where ID=1;

ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from t where ID=1' at line 1

Ps:一般語法錯誤會提示第一個出現錯誤的位置,所以你要關注的是緊接“use near”的內容。

 

5、優化器(怎麼做)

*優化器是在表裏面有多個索引的時候,決定使用哪個索引;或者在一個語句有多表關聯(join)的時候,決定各個表的連接順序。
 

6、執行器(做)

*開始執行的時候,要先判斷一下你對這個表 T 有沒有執行查詢的權限,如果沒有,就會返回沒有權限的錯誤,如下所示 (在工程實現上,如果命中查詢緩存,會在查詢緩存返回結果的時候,做權限驗證。查詢也會在優化器之前調用 precheck 驗證權限)
mysql> select * from T where ID=10;

ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'T'

如果有權限,就打開表繼續執行。打開表的時候,執行器就會根據表的引擎定義,去使用這個引擎提供的接口。

 
*例子:假如表 T 中,ID 字段沒有索引,那麼執行器的執行流程是這樣的:調用 InnoDB 引擎接口取這個表的第一行,判斷 ID 值是不是 10,如果不是則跳過,如果是則將這行存在結果集中;調用引擎接口取“下一行”,重複相同的判斷邏輯,直到取到這個表的最後一行。執行器將上述遍歷過程中所有滿足條件的行組成的記錄集作爲結果集返回給客戶端。(對於有索引的表,執行的邏輯也差不多。第一次調用的是“取滿足條件的第一行”這個接口,之後循環取“滿足條件的下一行”這個接口,這些接口都是引擎中已經定義好的。)
 
*在數據庫的慢查詢日誌中看到一個 rows_examined 的字段,表示這個語句執行過程中掃描了多少行。這個值就是在執行器每次調用引擎獲取數據行的時候累加的。在有些場景下,執行器調用一次,在引擎內部則掃描了多行,因此引擎掃描行數跟 rows_examined 並不是完全相同的。

 

7、課後題目

*如果表 T 中沒有字段 k,而你執行了這個語句 select * from T where k=1, 那肯定是會報“不存在這個列”的錯誤: “Unknown column ‘k’ in ‘where clause’”。你覺得這個錯誤是在我們上面提到的哪個階段報出來的呢?
答:分析器。應該是語法分析(個人感覺)
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章