Mysql語句的執行順序

MySQL的語句一共分爲11步,如下圖所標註的那樣,最先執行的總是FROM操作,最後執行的是LIMIT操作。其中每一個操作都會產生一張虛擬的表,這個虛擬的表作爲一個處理的輸入,只是這些虛擬的表對用戶來說是透明的,但是隻有最後一個虛擬的表纔會被作爲結果返回。如果沒有在語句中指定某一個子句,那麼將會跳過相應的步驟。
這裏寫圖片描述

下面我們來具體分析一下查詢處理的每一個階段:

(1)FORM: 對FROM的左邊的表和右邊的表計算笛卡爾積。產生虛表VT1。(選擇相對小的表做基礎表)

(2)ON: 對虛表VT1進行ON篩選,只有那些符合的行纔會被記錄在虛表VT2中。

(3)JOIN: 如果指定了OUTER JOIN(比如left join、 right join),那麼保留表中未匹配的行就會作爲外部行添加到虛擬表VT2中,產生虛擬表VT3, 如果 from子句中包含兩個以上的表的話,那麼就會對上一個join連接產生的結果VT3和下一個表重複執行步驟1~3這三個步驟,一直到處理完所有的表爲止。

(4)WHERE: 對虛擬表VT3進行WHERE條件過濾。只有符合的記錄纔會被插入到虛擬表VT4中。

(5)GROUP BY: 根據group by子句中的列,對VT4中的記錄進行分組操作,產生VT5。

(6)CUBE | ROLLUP: 對錶VT5進行cube或者rollup操作,產生表VT6。

(7)HAVING: 對虛擬表VT6應用having過濾,只有符合的記錄纔會被 插入到虛擬表VT7中。

(8)SELECT: 執行select操作,選擇指定的列,插入到虛擬表VT8中。

(9)DISTINCT: 對VT8中的記錄進行去重。產生虛擬表VT9.

(10)ORDER BY: 將虛擬表VT9中的記錄按照進行排序操作,產生虛擬表VT10.

(11)LIMIT:取出指定行的記錄,產生虛擬表VT11, 並將結果返回。

有幾個問題需要特別留意下:

1)對於包含outer join子句的查詢,就有一個讓人感到困惑的問題,到底在on篩選器還是用where篩選器指定邏輯表達式呢?

on和where的最大區別在於,如果在on應用邏輯表達式中,那麼在第三步outer join中還可以把移除的行再次添加回來,而where的移除後得到的是最終結果。

舉個簡單的例子,有一個學生表(班級,姓名)和一個成績表(姓名,成績),我現在需要返回一個x班級的全體同學的成績,但是這個班級有幾個學生缺考,也就是說在成績表中沒有記錄。爲了得到我們預期的結果我們就需要在on子句指定學生和成績表的關係(學生.姓名=成績.姓名)那麼我們是否發現在執行第二步的時候,對於沒有參加考試的學生記錄就不會出現在vt2中,因爲他們被on的邏輯表達式過濾掉了,但是我們用left outer join就可以把左表(學生)中沒有參加考試的學生找回來,因爲我們想返回的是x班級的所有學生,如果在on中應用學生.班級=’x’的話,left outer join會把所有班級的所有學生記錄找回,所以只能在where篩選器中應用學生.班級=’x’ 因爲它的過濾是最終的。

2)GROUP BY語句和DISTINCT語句不能同時用在同一個字段上!!!

事實上如果應用了group by子句那麼distinct是多餘的,原因同樣在於,分組的時候是將列中唯一的值分成一組,同時只爲每一組返回一行記錄,那麼所以的記錄都將是不相同的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章