數據庫在通過連接兩張或多張表來返回記錄時,都會生成一張中間的臨時表,然後再將這張臨時表返回給用戶。
在使用left jion時,on和where條件的區別如下:
1、 on條件是在生成臨時表時使用的條件,它不管on中的條件是否爲真,都會返回左邊表中的記錄。
2、where條件是在臨時表生成好後,再對臨時表進行過濾的條件。這時已經沒有left join的含義(必須返回左邊表的記錄)了,條件不爲真的就全部過濾掉。
假設有兩張表:
表1:tab2
表2:tab2
size
|
name
|
10
|
AAA
|
20
|
BBB
|
20
|
CCC
|
兩條SQL:
1、select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
2、select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)
第一條SQL的過程:
1、中間表
on條件:
tab1.size = tab2.size |
tab1.id |
tab1.size |
tab2.size |
tab2.name |
1
|
10
|
10
|
AAA
|
2
|
20
|
20
|
BBB
|
2
|
20
|
20
|
CCC
|
3
|
30
|
(null)
|
(null)
|
|
|
|
|
|
2、再對中間表過濾
where 條件:
tab2.name=’AAA’
|
tab1.id |
tab1.size |
tab2.size |
tab2.name |
1
|
10
|
10
|
AAA
|
|
|
|
|
第二條SQL的過程:
1、中間表
on條件:
tab1.size = tab2.size and tab2.name=’AAA’ (條件不爲真也會返回左表中的記錄) |
tab1.id |
tab1.size |
tab2.size |
tab2.name |
1
|
10
|
10
|
AAA
|
2
|
20
|
(null)
|
(null)
|
3
|
30
|
(null)
|
(null)
|
|
|
其實以上結果的關鍵原因就是left join,right join,full join的特殊性,不管on上的條件是否爲真都會返回left或right表中的記錄,full則具有left和right的特性的並集。 而inner jion沒這個特殊性,則條件放在on中和where中,返回的結果集是相同的。
on、where、having的區別
on、where、having這三個都可以加條件的子句中,on是最先執行,where次之,having最後。有時候如果這先後順序不影響中間結果的話,那最終結果是相同的。但因爲on是先把不符合條件的記錄過濾後才進行統計,它就可以減少中間運算要處理的數據,按理說應該速度是最快的。
根據上面的分析,可以知道where也應該比having快點的,因爲它過濾數據後才進行sum,所以having是最慢的。但也不是說having沒用,因爲有時在步驟3還沒出來都不知道那個記錄才符合要求時,就要用having了。
在兩個表聯接時才用on的,所以在一個表的時候,就剩下where跟having比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結果是一樣的,只是where可以使用rushmore技術,而having就不能,在速度上後者要慢。
如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據上篇寫的工作流程,where的作用時間是在計算之前就完成的,而having就是在計算後才起作用的,所以在這種情況下,兩者的結果會不同。
在多表聯接查詢時,on比where更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表後,再由where進行過濾,然後再計算,計算完後再由having進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什麼時候起作用,然後再決定放在那裏
JOIN聯表中ON,WHERE後面跟條件的區別
對於JOIN的連表操作,這裏就不細述了,當我們在對錶進行JOIN關聯操作時,對於ON和WHERE後面的條件,不清楚大家有沒有注意過,有什麼區別,可能有的朋友會認爲跟在它們後面的條件是一樣的,你可以跟在ON後面,如果願意,也可以跟在WHERE後面。它們在ON和WHERE後面究竟有一個什麼樣的區別呢?
在JOIN操作裏,有幾種情況。LEFT JOIN,RIGHT JOIN,INNER JOIN等。
爲了清楚的表達主題所描述的問題,我簡要的對LEFT,RIGHT,INNER這幾種連接方式作一個說明。
下面就拿一個普通的博客系統的日誌表(post)和分類表(category)來描述吧。
這裏我們規定有的日誌可能沒有分類,有的分類可能目前沒有屬於它的文章。
1. LEFT JOIN:
(保證找出左聯表中的所有行)
查出所有文章,並顯示出他們的分類:
SELECT p.title,c.category_name FROM post p LEFT JOIN category c ON p.cid = c.cid
2. RIGHT JOIN:
(保證找出右聯表中的所有行)
查詢所有的分類,並顯示出該分類所含有的文章數。
SELECT COUNT(p.id),c.category_name FROM post p RIGHTJOIN category c ON p.pid = c.cid
3. INNER JOIN
(找出兩表中關聯相等的行)
查詢有所屬分類的日誌。(即那些沒有所性分類的日誌文章將不要我們的查詢範圍之內)。
SELECT p.title,c.category_name FROM post p INNER JOIN category c ON p.cid = c.cid.
這種情況和直接兩表硬關聯等價。
現在我們回過頭來看上面的問題。
對於第一種情況,如果我們所ON 的條件寫在WHERE 後面,將會出現什麼情況呢?
即:
SELECT p.title,c.category_name FROM post p LEFT JOIN category c WHERE p.cid = c.cid
對於第二種情況,我們同樣按照上面的書寫方式。
SELECT COUNT(p.id),c.category_name FROM post p RIGHTJOIN category c WHERE p.pid = c.cid
如果運行上面的SQL語句,就會發現,它們已經過濾掉了一些不滿足條件的記錄,可能在這裏,大家會產生疑問了,不是用了LEFT和RIGHT嗎?它們可以保證左邊或者右邊的所有行被全部查詢出來,爲什麼現在不管用了呢?對於出現這種的問題,呵呵!是不是覺得有些不可思議。
出現這種的問題,原因就在WHERE和ON這兩個關鍵字後面跟條件。
好了,現在我也不調大家味口了,給大家提示答案吧。
對於JOIN參與的表的關聯操作,如果需要不滿足連接條件的行也在我們的查詢範圍內的話,我們就必需把連接條件放在ON後面,而不能放在WHERE後面,如果我們把連接條件放在了WHERE後面,那麼所有的LEFT,RIGHT,等這些操作將不起任何作用,對於這種情況,它的效果就完全等同於INNER連接。對於那些不影響選擇行的條件,放在ON或者WHERE後面就可以。
記住:所有的連接條件都必需要放在ON後面,不然前面的所有LEFT,和RIGHT關聯將作爲擺設,而不起任何作用。
|