SQL读书笔记（七）数据分组

原創

2020-02-21 04:46

笔记参考与SQL必知必会，是新手很好的读物，摘抄下来作为笔记方便以后需要时查找

这篇主要是SQL的数据分组

什么是数据的分组，按我的理解就是我们对一些数据进行分类处理，我们可能需要将数据分成一组组的来处理，例如我们可能有很多的订单，但我们需要知道每个订单的数量，来计算我们整体的利润，这样我们就需要将每种相同产品的订单的数量，这样我们就可以将每种相同的订单分成一个组，来直观的看出每种订单的数量。

使用分组可以将数据分为多个逻辑组，对每个组进行聚集计算。

1、创建分组
SELECT vend_id, COUNT(*) AS num_prods FROM Products GROUP BY vend_id;

vend_id num_prods
——- ——–
BRS01 3
DLL01 4
FNG01 2

上面的SELECT语句指定了两个列：vend_id包含产品供应商的ID，num_prods为计算字段（用COUNT(*)函数建立）。GROUP BY子句指示 DBMS按vend_id排序并分组数据。这就会对每个vend_id而不是整个表计算num_prods一次。从输出中可以看到，供应商BRS01有3个产品，供应商DLL01有4个产品，而供应商FNG01有2个产品

在使用GROUP BY子句前，需要知道一些重要的规定。

GROUP BY子句可以包含任意数目的列，因而可以对分组进行嵌套，更细致地进行数据分组。

如果在GROUP BY子句中嵌套了分组，数据将在最后指定的分组上进行汇总。换句话说，在建立分组时，指定的所有列都一起计算（所以不能从个别的列取回数据）。

GROUP BY子句中列出的每一列都必须是检索列或有效的表达式（但不能是聚集函数）。如果在SELECT中使用表达式，则必须在GROUP BY子句中指定相同的表达式。不能使用别名。

大多数SQL实现不允许GROUP BY列带有长度可变的数据类型（如文本或备注型字段）。

除聚集计算语句外，SELECT语句中的每一列都必须在GROUP BY子句中给出。

如果分组列中包含具有NULL值的行，则NULL将作为一个分组返回。如果列中有多行NULL值，它们将分为一组。

GROUP BY子句必须出现在WHERE子句之后，ORDER BY子句之前。

2、过滤分组

HAVING非常类似于WHERE。事实上，目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是，WHERE过滤行，而HAVING过滤分组。学过的这些有关WHERE的所有技术和选项都适用于HAVING。它们的句法是相同的，只是关键字有差别。

过滤分组我的理解就是分完组之后进行过滤，但group by必须在where之后，所有使用HAVING，但也就是这么理解，按理说where是过滤行，不能对组合进行过滤。

SELECT cust_id, COUNT() AS orders FROM Orders GROUP BY cust_id HAVING COUNT() >= 2;

这条SELECT语句的前三行类似于上面的语句。最后一行增加了HAVING子句，它过滤COUNT(*) >= 2（两个以上订单）的那些分组。
可以看到，WHERE子句在这里不起作用，因为过滤是基于分组聚集值，而不是特定行的值

SELECT vend_id, COUNT() AS num_prods FROM Products WHERE prod_price >= 4 GROUP BY vend_id HAVING COUNT() >= 2;

这条语句中，第一行是使用了聚集函数的基本SELECT语句，很像前面的例子。WHERE子句过滤所有prod_price至少为4的行，然后按vend_id分组数据，HAVING子句过滤计数为2或2以上的分组。如果没有WHERE子句，就会多检索出一行

3、分组和排序

SELECT order_num, COUNT(*) AS items
FROM OrderItems
GROUP BY order_num
HAVING COUNT(*) >= 3 ORDERBY items, order_num;

小疯疯0413

发布了83 篇原创文章 · 获赞 68 · 访问量 16万+

私信关注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

SQL读书笔记（七）数据分组

一键自动化博客发布工具,用过的人都说好(掘金篇)

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

[转帖]

python列出centos7内存使用前50的进程信息

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

nodejs学习06——小案例

评估统计算法在银行伪造钞票检测中的价值

C# Xmlserializer 程序集内存泄露

Java ThreadPoolShutdown

5月21日相聚上海张江！与文心大模型一起共建大模型产业应用生态圈

SQL讀書筆記（四）

每日一bootstrap 下拉菜單

node.js 異步I/O

SQL讀書筆記（十）創建和操縱表

操作系統筆記（二）操作系統類型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

SQL读书笔记（七） 数据分组

SQL读书笔记（七）数据分组