来源:中国统计网
DROP TABLE IF EXISTS Marks;CREATE TABLE Marks(学生 VARCHAR(10),
科目 CHAR(2),
分数 INT);
insert into Marks values
('赵四','语文',88),('赵四','数学',48),('赵四','英语',75),
('张三','语文',30),('张三','数学',75),('张三','英语',75),
('王五','语文',90),('王五','数学',94),('王五','英语',70),
('李四','语文',82),('李四','数学',69),('李四','英语',90);
SELECT * FROM Marks;
-- 作为窗口函数
SELECT 学生,科目,分数,
SUM(分数) OVER (PARTITION BY 学生) AS '总分'
FROM Marks;
-- 与直接使用sum()聚合函数得到的结果一样
SELECT 学生,SUM(分数) AS '总分'
FROM Marks
GROUP BY 学生;
窗口函数的语法
window_function_name(expression)
OVER (
[partition_defintion]
[order_definition]
[frame_definition]
)
PARTITION BY expr [, expr] ...
ORDER BY expr [ASC|DESC] [, expr [ASC|DESC]] ...
SELECT 学生,科目,分数,
MAX(分数) OVER (PARTITION BY 学生 ORDER BY 分数 DESC) AS '最高分'
FROM Marks;
frame_clause:
frame_units frame_extentframe_units:
| RANGE}frame_extent:
| frame_between}frame_between:
BETWEEN frame_start AND frame_endframe_start, frame_end: {
CURRENT ROW
UNBOUNDED PRECEDING
UNBOUNDED FOLLOWING
expr PRECEDING
expr FOLLOWING}
SELECT 学生,科目,分数,
AVG(分数) OVER (PARTITION BY 学生
ORDER BY 分数 ASC
ROWS 2 preceding) AS moving_avg
FROM Marks;
SELECT 学生,科目,分数,
AVG(分数) OVER (PARTITION BY 学生
ORDER BY 分数 ASC
RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS AVGFROM Marks;
CURRENT ROW: 当前行
UNBOUNDED PRECEDING: 区间的第一行
UNBOUNDED FOLLOWING:区间的最后一行
N PRECEDING: 当前行之前的N行,可以是数字,也可以是一个能计算出数字的表达式
N FOLLOWING:当前行之后的N行,可以是数字,也可以是一个能计算出数字的表达式
如果有ORDER BY,SQL会默认帧是区间内从第一行(UNBOUNDED PRECEDING)到当前行(CURRENTROW)
SELECT 学生,科目,分数,
MAX(分数) OVER (PARTITION BY 学生
ORDER BY 分数 ASC) AS '最高分' FROM Marks;-- 结果相同SELECT 学生,科目,分数,
MAX(分数) OVER (PARTITION BY 学生
ORDER BY 分数 ASC
RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS '最高分' FROM Marks;
如果没有ORDER BY,SQL会默认帧是区间内从第一行(UNBOUNDED PRECEDING)到最后一行(UNBOUNDED FOLLOWING)
SELECT 学生,科目,分数,
MAX(分数) OVER (PARTITION BY 学生) AS '最高分'
FROM Marks;
-- 结果相同
SELECT 学生,科目,分数,
MAX(分数) OVER (PARTITION BY 学生
RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) AS '最高分'
FROM Marks;
ROW_NUMBER: 函数名即是排序方法,也就是输出结果集分区的行号(例如:1,2,3,4,5...)
RANK: 返回结果集的分区内数据进行跳跃排序。也就是为相同数值的行输出相同排序结果,对于下一行不同的数据将返回行号(例如:1,1,3,4...)
DENSE_RANK: 返回结果集分区中每行的连续排名,排名值没有间断。行排名等于该行之前不同排名值的数量加一(例如:1,1,2,3,4...)
NTILE: 将有序分区中的数据分发到指定数目的组中。以本文数据为例,将60-90分的分数等分为4组,即第1组为[90, 82.5),第2组为[82.5, 75),第3组为[75, 67.5),第4组为[67.5, 60]
SELECT 学生,科目,分数
,ROW_NUMBER() OVER (PARTITION BY 科目 ORDER BY 分数 DESC) AS "Row_Number"
,RANK() OVER (PARTITION BY 科目 ORDER BY 分数 DESC) AS 'Rank'
,DENSE_RANK() OVER (PARTITION BY 科目 ORDER BY 分数 DESC) AS "Dense_Rank"
,NTILE(4) OVER (PARTITION BY 科目 ORDER BY 分数 DESC) AS 'Quartile'
FROM Marks;
后台回复暗号「进群」,即刻加入读者交流群~
本文分享自微信公众号 - 凹凸数据(alltodata)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。