SQL和MYSQL語句的執行順序

MYSQL執行順序


一、語法順序和執行順序

(1)SQL語句的語法順序:

   SELECT[DISTINCT]

   FROM

   JOIN

   ON

   WHERE

  GROUP BY

  HAVING

  UNION

  ORDER BY

  LIMIT

(2)SQL的執行順序

 FROM:將數據從硬盤加載到數據緩衝區,方便對接下來的數據進行操作。

 WHERE:從基表或視圖中選擇滿足條件的元組。(不能使用聚合函數)

 JOIN(如right left 右連接-------從右邊表中讀取某個元組,並且找到該元組在左邊表中對應的元組或元組集)

 ON:join on實現多表連接查詢,推薦該種方式進行多表查詢,不使用子查詢。

 GROUP BY:分組,一般和聚合函數一起使用。

 HAVING:在元組的基礎上進行篩選,選出符合條件的元組。(一般與GROUP BY進行連用)

SELECT:查詢到得所有元組需要羅列的哪些列。

DISTINCT:去重的功能。

UNION:將多個查詢結果合併(默認去掉重複的記錄)。

ORDER BY:進行相應的排序。

LIMIT 1:顯示輸出一條數據記錄(元組)

從這個順序中我們不難發現,所有的 查詢語句都是從from開始執行的,在執行過程中,每個步驟都會爲下一個步驟生成一個虛擬表,這個虛擬表將作爲下一個執行步驟的輸入。

第一步:
首先對from子句中的前兩個表執行一個笛卡爾乘積,此時生成虛擬表 vt1(選擇相對小的表做基礎表)
第二步:
接下來便是應用on篩選器,on 中的邏輯表達式將應用到 vt1 中的各個行,篩選出滿足on邏輯表達式的行,生成虛擬表 vt2
第三步:
如果是outer join 那麼這一步就將添加外部行,left outer jion 就把左表在第二步中過濾的添加進來,如果是right outer join 那麼就將右表在第二步中過濾掉的行添加進來,這樣生成虛擬表 vt3
第四步:
如果 from 子句中的表數目多餘兩個表,那麼就將vt3和第三個表連接從而計算笛卡爾乘積,生成虛擬表,該過程就是一個重複1-3的步驟,最終得到一個新的虛擬表 vt3。
第五步:
應用where篩選器,對上一步生產的虛擬表引用where篩選器,生成虛擬表vt4,在這有個比較重要的細節不得不說一下,對於包含outer join子句的查詢,就有一個讓人感到困惑的問題,到底在on篩選器還是用where篩選器指定邏輯表達式呢?on和where的最大區別在於,如果在on應用邏輯表達式那麼在第三步outer join中還可以把移除的行再次添加回來,而where的移除的最終的。舉個簡單的例子,有一個學生表(班級,姓名)和一個成績表(姓名,成績),我現在需要返回一個x班級的全體同學的成績,但是這個班級有幾個學生缺考,也就是說在成績表中沒有記錄。爲了得到我們預期的結果我們就需要在on子句指定學生和成績表的關係(學生.姓名=成績.姓名)那麼我們是否發現在執行第二步的時候,對於沒有參加考試的學生記錄就不會出現在vt2中,因爲他們被on的邏輯表達式過濾掉了,但是我們用left outer join就可以把左表(學生)中沒有參加考試的學生找回來,因爲我們想返回的是x班級的所有學生,如果在on中應用學生.班級='x’的話,left outer join會把x班級的所有學生記錄找回(感謝網友康欽謀__康欽苗的指正),所以只能在where篩選器中應用學生.班級=‘x’ 因爲它的過濾是最終的。

第六步:
group by 子句將中的唯一的值組合成爲一組,得到虛擬表vt5。如果應用了group by,那麼後面的所有步驟都只能得到的vt5的列或者是聚合函數(count、sum、avg等)。原因在於最終的結果集中只爲每個組包含一行。這一點請牢記。
第七步:
應用cube或者rollup選項,爲vt5生成超組,生成vt6.
第八步:
應用having篩選器,生成vt7。having篩選器是第一個也是爲唯一一個應用到已分組數據的篩選器。
第九步:
處理select子句。將vt7中的在select中出現的列篩選出來。生成vt8.
第十步:
應用distinct子句,vt8中移除相同的行,生成vt9。事實上如果應用了group by子句那麼distinct是多餘的,原因同樣在於,分組的時候是將列中唯一的值分成一組,同時只爲每一組返回一行記錄,那麼所以的記錄都將是不相同的。
第十一步:
應用order by子句。按照order_by_condition排序vt9,此時返回的一個遊標,而不是虛擬表。sql是基於集合的理論的,集合不會預先對他的行排序,它只是成員的邏輯集合,成員的順序是無關緊要的。對錶進行排序的查詢可以返回一個對象,這個對象包含特定的物理順序的邏輯組織。這個對象就叫遊標。正因爲返回值是遊標,那麼使用order by 子句查詢不能應用於表表達式。排序是很需要成本的,除非你必須要排序,否則最好不要指定order by,最後,在這一步中是第一個也是唯一一個可以使用select列表中別名的步驟。
第十二步:
應用top選項。此時才返回結果給請求者即用戶。

二、mysql的執行順序
SELECT語句定義
一個完成的SELECT語句包含可選的幾個子句。SELECT語句的定義如下:
SQL代碼

<SELECT clause> [<FROM clause>] [<WHERE clause>] [<GROUP BY clause>] [<HAVING clause>] [<ORDER BY clause>] [<LIMIT clause>]   

SELECT子句是必選的,其它子句如WHERE子句、GROUP BY子句等是可選的。
一個SELECT語句中,子句的順序是固定的。例如GROUP BY子句不會位於WHERE子句的前面。

SELECT語句執行順序

SELECT語句中子句的執行順序與SELECT語句中子句的輸入順序是不一樣的,所以並不是從SELECT子句開始執行的,而是按照下面的順序執行:

開始->FROM子句->WHERE子句->GROUP BY子句->HAVING子句->ORDER BY子句->SELECT子句->LIMIT子句->最終結果
每個子句執行後都會產生一箇中間結果,供接下來的子句使用,如果不存在某個子句,就跳過
對比了一下,mysql和sql執行順序基本是一樣的, 標準順序的 SQL 語句爲:

example

select 考生姓名, max(總成績) as max總成績   
  
from tb_Grade   
  
where 考生姓名 is not null   
  
group by 考生姓名   
  
having max(總成績) > 600   
  
order by max總成績   

在上面的示例中 SQL 語句的執行順序如下:

(1). 首先執行 FROM 子句, 從 tb_Grade 表組裝數據源的數據

(2). 執行 WHERE 子句, 篩選 tb_Grade 表中所有數據不爲 NULL 的數據

(3). 執行 GROUP BY 子句, 把 tb_Grade 表按 “學生姓名” 列進行分組(注:這一步開始纔可以使用select中的別名,他返回的是一個遊標,而不是一個表,所以在where中不可以使用select中的別名,而having卻可以使用,感謝網友 zyt1369 提出這個問題)

(4). 計算 max() 聚集函數, 按 “總成績” 求出總成績中最大的一些數值

(5). 執行 HAVING 子句, 篩選課程的總成績大於 600 分的.

(7). 執行 ORDER BY 子句, 把最後的結果按 “Max 成績” 進行排序.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章