在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數,
例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
SELECT SUM(population) FROM bbc
這裏的SUM作用在所有返回記錄的population字段上,結果就是該查詢只返回一個結果,即所有
國家的總人口數。
having是分組(group by)後的篩選條件,分組後的數據組內再篩選
where則是在分組前篩選
通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬於一組的數據起作用。
當你指定 GROUP BY region 時, 屬於同一個region(地區)的一組數據將只能返回一行值.
也就是說,表中所有除region(地區)外的字段,只能通過 SUM, COUNT等聚合函數運算後返回一個值.
HAVING子句可以讓我們篩選成組後的各組數據.
WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合後對組記錄進行篩選。
讓我們還是通過具體的實例來理解GROUP BY 和 HAVING 子句,還採用第三節介紹的bbc表。
SQL實例:
一、顯示每個地區的總人口數和總面積.
SELECT region, SUM(population), SUM(area)
FROM bbc# `& e4 k' X* n1 v% ?+ |
GROUP BY region
先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用聚合函數對每組中的不同字段(一或多條記錄)作運算。# B* i' z `, }* S, E5 i
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
SELECT region, SUM(population), SUM(area)7 ]; Z& I! t% i
FROM bbc8 F4 w2 v( P- f
GROUP BY region
HAVING SUM(area)>1000000# y" P z. O7 D9 `# X
在這裏,我們不能用where來篩選超過1000000的地區,因爲表中不存在這樣一條記錄。
相反,HAVING子句可以讓我們篩選成組後的各組數據
三、查詢CUSTOMER 和ORDER表中用戶的訂單數
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id;
+--------+-------+
| name | count |
+--------+-------+
| d | 9 |
| cc | 6 |
| 菩提子 | 1 |
| cccccc | 2 |
+--------+-------+
增加HAVING過濾
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id having count(order_number)>5;
+------+-------+
| name | count |
+------+-------+
| d | 9 |
| cc | 6 |
+------+-------+
四、我在多舉一些例子
SQL> select * from sc;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 YW 89
2 SX 91
2 YY 92
3 YW 85
3 SX 88
3 YY 96
4 YW 95
4 SX 89
SNO PNO GRADE
---------- ----- ----------
4 YY 88
這個表所描述的是4個學生對應每科學習成績的記錄,其中SNO(學生號)、PNO(課程名)、GRADE(成績)。
1、顯示90分以上學生的課程名和成績
//這是一個簡單的查詢,並沒有使用分組查詢
SQL> select sno,pno,grade from sc where grade>=90;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 SX 91
2 YY 92
3 YY 96
4 YW 95
已選擇7行。
2、顯示每個學生的成績在90分以上的各有多少門
//進行分組顯示,並且按照where條件之後計數
SQL> select sno,count(*) from sc where grade>=90 group by sno;
SNO COUNT(*)
---------- ----------
1 3
2 2
4 1
3 1
3、這裏我們並沒有使用having語句,接下來如果我們要評選三好學生,條件是至少有兩門課程在90分以上纔能有資格,列出有資格的學生號及90分以上的課程數。
//進行分組顯示,並且按照where條件之後計數,在根據having子句篩選分組
SQL> select sno,count(*) from sc where grade>=90 group by sno having count(*)>=2;
SNO COUNT(*)
---------- ----------
1 3
2 2
這個結果是我們想要的,它列出了具有評選三好學生資格的學生號,跟上一個例子比較之後,發現這是在分組後進行的子查詢。
4、學校評選先進學生,要求平均成績大於90分的學生都有資格,並且語文課必須在95分以上,請列出有資格的學生
//實際上,這個查詢先把語文大於95分的學生號提取出來,之後求平均值,分組顯示後根據having語句選出平均成績大於90的
SQL> select sno,avg(grade) from sc where SNO IN (SELECT SNO FROM SC WHERE GRADE>=95 AND PNO='YW') group by sno having avg(grade)>=90;
SNO AVG(GRADE)
---------- ----------
1 94.3333333
4 90.6666667
5、查詢比平均成績至少比學號是3的平均成績高的學生學號以及平均分數
//having子句中可進行比較和子查詢
SQL> select sno,avg(grade) from sc
group by sno
having avg(grade) > (select avg(grade) from sc where sno=3);