帶你學MySQL系列 | 困擾MySQL初學者的分組聚合查詢,我終於講明白了!

1.分組查詢的原理圖

在這裏插入圖片描述
對上述原始數據,按照DEPARTMENT_ID(員工id)分組統計SALARY(薪水)平均值
在這裏插入圖片描述
上述原理寫成代碼,應該怎麼寫呢?

select 
	department_id,avg(salary)
from 
	test
group by 
	department_id;

可以清楚地看到,使用department_id進行分組後,系統默認將department_id相同的號所在的行,分配在一起,你有幾個不同的department_id,就會分爲幾組,每個組中的數據行數,不一定都要相同。

當自動分配完成後,會根據你所寫的分組函數,進行組內運算

也就是說,你使用的是sum()函數,就會組內求和;當你使用的是avg()函數,就會組內求平均值;當你使用的是count()函數,就會進行組內計數;當你使用的是max()函數,就會進行組內求最大值;你使用的是min()函數,就會進行組內求最小值。

2.group by關鍵字語法詳解

有些小白在學習MySQL的過程中,很多都是在group by關鍵字這個地方卡殼。於是我希望自己能夠用白話圖文的方式,讓你真正搞明白這個關鍵字的含義。
在這裏插入圖片描述
group by是用於分組查詢的關鍵字,一般是配合sum(),avg(),count(),max(),min()聚合函數使用的。也就是說SQL語句中只要有group by,那麼在select後面的展示字段中一般會有聚合函數(5個聚合函數)中的一個或多個函數出現。觀察上圖,有一點你需要記住,你用表中的字段A進行分組後,一般就需要對錶中的其它字段,使用聚合函數,這樣意義更大,而不是還對字段A使用聚合函數,沒啥太大意義。

我們再思考下面這個問題!

當SQL語句中使用了group by後,在select後面一定有一個字段使用了聚合函數(5個聚合函數)。但是除了這個聚合函數,select後面還可以添加其他什麼字段嗎?

答案肯定是可以的!但是該字段有一定的限制,並不是什麼字段都可以。也就是說,當SQL語句中使用了group by關鍵字後,select後面除了聚合函數,就只能是group by後面出現的字段。也就是圖中的字段A,select後面只能存在group by後面的字段。

3.一個簡單的分組查詢的案例

案例 :按照部門編號deptno分組,統計每個部門的平均工資。

select 
    deptno,avg(sal) avgs
from 
    emp
group by 
    deptno

結果如下:
在這裏插入圖片描述

4.分組前篩選和分組後篩選

這個知識點就是要帶着大家理解一下,什麼使用該用where篩選?什麼時候該用having篩選?這個知識點對於學習MySQL的小白來說,也是一個棘手的事兒。不用擔心,跟着黃同學學MySQL,沒有學不會的。

1)原始表和結果集的概念

  • 原始表指的是數據庫中真正存在的那個表,使用【select * from 表名】查詢出來的就是原始表信息。
  • 結果集指的是在SQL語句中,添加其它任何一個限制條件,最終展示給我們表,都是結果集。添加不同的限制條件,查詢出來的結果集也是不同的。
  • 原始表只有一個,結果集卻是各種各樣的。

2)黃同學支大招

  • 只要是需求中,涉及到聚合函數做條件的情況,一定是分組後的篩選。
  • 能用分組前篩選的,就優先考慮分組前的篩選。(考慮到性能問題)
    在這裏插入圖片描述

3)案例講解

原始數據集如下:
在這裏插入圖片描述

① 分組前篩選

習題一:查詢姓名中包含S字符的,每個部門的工資之和。
在這裏插入圖片描述
習題二:查詢工資大於2000的,不同部門的平均工資。
在這裏插入圖片描述

② 分組後篩選

習題一:查詢部門員工個數大於3的部門編號和員工個數。
在這裏插入圖片描述
習題二:查詢每個部門最高工資大於3000的部門編號和最高工資。
在這裏插入圖片描述

③ 分組前篩選和分組後篩選合用

習題:查詢1981年入職的,不同部門間工資的平均值大於2000的部門編號和平均值。
在這裏插入圖片描述

5.分組查詢(按函數分組)

習題:按員工姓名的長度分組,查詢每一組的員工個數,篩選員工個數>3的有哪些?

select length(ename) len,count(*) counts
from emp
group by len
having counts > 3;

結果如下:
在這裏插入圖片描述

6.分組查詢(按多個字段分組)

習題:查詢每個部門每個工種的員工的平均工資。
在這裏插入圖片描述

7.group by和order by,一對老搭檔

習題一:查詢每個部門的員工的平均工資,按照平均工資降序。
在這裏插入圖片描述
習題二:查詢每個部門的員工的平均工資,按照平均工資升序。
在這裏插入圖片描述

8.分組查詢的總結

  • 1)分組函數做條件,肯定是放在having子句中。
  • 2)能用分組前篩選的,就優先考慮使用分組前篩選。(where篩選)
  • 3)group by子句支持單個字段分組,多個字段分組(多個字段之間用逗號隔開沒有順序要求),還支持函數分組(用的較少)。
      

       

關注微信公衆號『數據分析與統計學之美』,後臺回覆“入羣”拉你入羣交流哦,氣氛槓槓的!看到這裏,麻煩您點個再看,讓更多朋友看到哦!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章