T-SQL查詢進階--深入理解子查詢



引言

 

      SQL有着非常強大且靈活的查詢方式,而多表連接操作往往也可以用子查詢進行替代,本篇文章將會講述子查詢的方方面面。

 

簡介

 

      子查詢本質上是嵌套進其他SELECT,UPDATE,INSERT,DELETE語句的一個被限制的SELECT語句,在子查詢中,只有下面幾個子句可以使用

  1. SELECT子句(必須)
  2. FROM子句(必選)
  3. WHERE子句(可選)
  4. GROUP BY(可選)
  5. HAVING(可選)
  6. ORDER BY(只有在TOP關鍵字被使用時纔可用)

    子查詢也可以嵌套在其他子查詢中,這個嵌套最多可達32層。子查詢也叫內部查詢(Inner query)或者內部選擇(Inner Select),而包含子查詢的查詢語句也叫做外部查詢(Outter)或者外部選擇(Outer Select),子查詢的概念可以簡單用下圖闡述:

1

   

     上圖是作爲數據源使用的一個子查詢.

     通常來講,子查詢按照子查詢所返回數據的類型,可以分爲三種,分別爲:

  1. 返回一張數據表(Table)
  2. 返回一列值(Column)
  3. 返回單個值(Scalar)

     下面,我們按照這三種方式來闡述子查詢

 

子查詢作爲數據源使用

     當子查詢在外部查詢的FROM子句之後使用時,子查詢被當作一個數據源使用,即使這時子查詢只返回一個單一值(Scalar)或是一列值(Column),在這裏依然可以看作一個特殊的數據源,即一個二維數據表(Table).作爲數據源使用的子查詢很像一個View(視圖),只是這個子查詢只是臨時存在,並不包含在數據庫中。

     比如這個語句:

SELECT     P.ProductID, P.Name, P.ProductNumber, M.Name AS ProductModelName
FROM         Production.Product AS P INNER JOIN
(SELECT     Name, ProductModelID
 FROM          Production.ProductModel) AS M 
ON P.ProductModelID = M.ProductModelID

    上述子查詢語句將ProductModel表中的子集M,作爲數據源(表)和Product表進行內連接。結果如下:

   2

    作爲數據源使用也是子查詢最簡單的應用。當然,當子查詢作爲數據源使用時,也分爲相關子查詢無關子查詢,這會在文章後面介紹到.

 

子查詢作爲選擇條件使用

 

    作爲選擇條件的子查詢也是子查詢相對最複雜的應用.

    作爲選擇條件的子查詢是那些只返回一列(Column)的子查詢,如果作爲選擇條件使用,即使只返回單個值,也可以看作是隻有一行一列.比如:

    在AdventureWorks中:

    我想取得總共請病假天數大於68小時的員工:

SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact]
  WHERE ContactID IN 

  (SELECT EmployeeID
  FROM [AdventureWorks].[HumanResources].[Employee]
  WHERE SickLeaveHours>68)

   結果如下:

   3

 

   上面的查詢中,在IN關鍵字後面的子查詢返回一列值作爲外部查詢選擇條件使用.

   同樣的,與IN關鍵字的邏輯取反的NOT IN關鍵字,這裏就不再闡述了

   但是要強調的是,不要用IN和NOT IN關鍵字,這會引起很多潛在的問題,這篇文章對這個問題有着很好的闡述:http://wiki.lessthandot.com/index.php/Subquery_typo_with_using_in。這篇文章的觀點是永遠不要再用IN和NOT IN關鍵字,我的觀點是存在即合理,我認爲只有在IN裏面是固定值的時候纔可以用IN和NOT IN,比如:

SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact]
  WHERE ContactID  IN (25,33)

   只有在上面這種情況下,使用IN和NOT IN關鍵字纔是安全的,其他情況下,最好使用EXISTS,NOT EXISTS,JOIN關鍵字來進行替代. 除了IN之外,用於選擇條件的關鍵字還有ANYALL,這兩個關鍵字和其字面意思一樣. 和"<",">",”="連接使用,比如上面用IN的那個子查詢:

   我想取得總共請病假天數大於68小時的員工

   用ANY關鍵字進行等效的查詢爲:

SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact]
  WHERE ContactID =ANY

  (SELECT EmployeeID
  FROM [AdventureWorks].[HumanResources].[Employee]
  WHERE SickLeaveHours>68)

   在作爲ANY和ALL關鍵字在子查詢中使用時,所實現的效果如下

=ANY 和IN等價
<>ALL 和NOT IN等價
>ANY 大於最小的(>MIN)
<ANY 小於最大的(<MAX)
>ALL 大於最大的(>MAX)
<ALL 小於最小的(<MIN)
=ALL 下面說

   =ALL關鍵字很少使用,這個的效果在子查詢中爲如果只有一個返回值,則和“=”相等,而如果有多個返回值,結果爲空

   這裏要注意,SQL是一種很靈活的語言,就像子查詢所實現的效果可以使用JOIN來實現一樣(效果一樣,實現思路不同),ANY和ALL所實現的效果也完全可以使用其他方式來替代,按照上面表格所示,>ANY和>MIN完全等價,比如下面兩個查詢語句完全等價:

SELECT *
FROM AdventureWorks.HumanResources.Employee
WHERE SickLeaveHours>ANY

(SELECT SickLeaveHours FROM AdventureWorks.HumanResources.Employee WHERE SickLeaveHours>68)


SELECT *
FROM AdventureWorks.HumanResources.Employee
WHERE SickLeaveHours>

(SELECT MIN(SickLeaveHours) FROM AdventureWorks.HumanResources.Employee WHERE SickLeaveHours>68)

 

 

相關子查詢和EXISTS關鍵字

   前面所說的查詢都是無關子查詢(Uncorrelated subquery),子查詢中還有一類很重要的查詢是相關子查詢(Correlated subquery),也叫重複子查詢比如,還是上面那個查詢,用相關子查詢來寫:

   我想取得總共請病假天數大於68天的員工:

SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact] c
  WHERE EXISTS

  (SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68)

   結果和使用IN關鍵字的查詢結果相同:

   3

   如何區別相關子查詢無關子查詢呢?最簡單的辦法就是直接看子查詢本身能否執行,比如上面的例子中的子查詢

(SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68)

   這一句本身執行本身會報錯.因爲這句引用到了外部查詢的表

   對於無關子查詢來說,整個查詢的過程爲子查詢只執行一次,然後交給外部查詢,比如:

  

SELECT *
FROM AdventureWorks.HumanResources.Employee
WHERE SickLeaveHours>ANY

SQLRESULT

   上面的無關子查詢,整個查詢過程可以看作是子查詢首先返回SQLResult(SQL結果集),然後交給外部查詢使用,整個過程子查詢只執行一次

    而相反,作爲相關子查詢,子查詢的執行的次數依賴於外部查詢,外部查詢每執行一行,子查詢執行一次,比如:

    還是上面的例子:我想取得總共請病假天數大於68天的員工

SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact] c
  WHERE EXISTS

  (SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68)

----
step 1:
SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact] c
  WHERE EXISTS

  (SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE 1=e.ContactID AND e.SickLeaveHours>68)
----
step 2:
SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact] c
  WHERE EXISTS

  (SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE 2=e.ContactID AND e.SickLeaveHours>68)
----
step n:
SELECT [FirstName]
      ,[MiddleName]
      ,[LastName]
  FROM [AdventureWorks].[Person].[Contact] c
  WHERE EXISTS

  (SELECT *
  FROM [AdventureWorks].[HumanResources].[Employee] e
  WHERE n=e.ContactID AND e.SickLeaveHours>68)
 

 

  如上面代碼所示。上面的相關子查詢實際上會執行N次(N取決與外部查詢的行數),外部查詢每執行一行,都會將對應行所用的參數傳到子查詢中,如果子查詢有對應值,則返回TRUE(既當前行被選中並在結果中顯示),如果沒有,則返回FALSE。然後重複執行下一行。

 

子查詢作爲計算列使用

    當子查詢作爲計算列使用時,只返回單個值(Scalar) 。用在SELECT語句之後,作爲計算列使用。同樣分爲相關子查詢無關子查詢

    相關子查詢的例子比如:我想取得每件產品的名稱和總共的銷量

SELECT [Name],
      (SELECT COUNT(*) FROM AdventureWorks.Sales.SalesOrderDetail S
      WHERE S.ProductID=P.ProductID) AS SalesAmount
FROM [AdventureWorks].[Production].[Product] P
  

   部分結果如下:

   5

   當子查詢作爲計算列使用時,會針對外部查詢的每一行,返回唯一的值。

   同樣的,SQL子查詢都可以使用其他語句達到同樣的效果,上面的語句和如下語句達到同樣的效果:

SELECT P.Name,COUNT(S.ProductID)
FROM [AdventureWorks].[Production].[Product] P 
LEFT JOIN  AdventureWorks.Sales.SalesOrderDetail S
ON S.ProductID=P.ProductID
GROUP BY P.Name
  

   子查詢作爲計算列且作爲無關子查詢時使用,只會一次性返回但一值,這裏就不再闡述了。

 

小結

     本篇文章通過子查詢的三種不同用途來闡述子查詢。同時,所有的子查詢還可以分爲相關子查詢和無關子查詢,而子查詢所實現的功能都可以使用連接或者其他方式實現。但一個好的作家應該是掌握豐富的詞彙,而不是僅僅能表達出自己的意思。學會多種SQL查詢方式是學習SQL查詢必經之路。

發佈了5 篇原創文章 · 獲贊 3 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章