在介紹group by 和having子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數,例如sum、count、max、 avg等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
select sum(population) from bbc
這裏的sum作用在所有返回記錄的population字段上,結果就是該查詢只返回一個結果,即所有國家的總人口數。
通過使用group by子句,可以讓sum 和count這些函數對屬於一組的數據起作用。當你指定group by region 時,
屬於同一個region(地區)的一組數據將只能返回一行值,也就是說,表中所有除region(地區)外的字段,只能通過 sum、count等聚合函數運算後返回一個值。
having子句可以讓我們篩選成組後的各組數據,where子句在聚合前先篩選記錄.也就是說作用在group by子句和having子句前.
而having子句在聚合後對組記錄進行篩選。
讓我們還是通過具體的實例來理解group by和having子句,還採用第三節介紹的bbc表。
SQL實例:
一、顯示每個地區的總人口數和總面積:
select region,sum(population),sum(area) from bbc group by region
先以region把返回記錄分成多個組,這就是group by的字面含義。分完組後,然後用聚合函數對每組中的不同字段(一或多條記錄)作運算。
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
select region,sum(population),sum(area) from bbc group by region having sum(area)>1000000
在這裏,我們不能用where來篩選超過1000000的地區,因爲表中不存在這樣一條記錄。
相反,having子句可以讓我們篩選成組後的各組數據.