不用的count用法

原創

2020-05-18 20:02

不用的count用法

讨论背景

在select count(?) from t 这样的查询语句里面，count(*), count(主键)，count(字段)和count(1)在性能上有差别。
今天就详细记录一下，这几种用法的差别。
需要注意的是，此处的讨论是基于MySQL的InnoDB引擎的。

这里，首先要弄清楚count的语义。count()是一个聚合函数，对于返回的结果集合，一行行地判断，如果count函数的参数不是NULL, 累计值就加1，否则不加。最后返回累计值。
所以，count(*), count(主键)和count(1)都表示返回满足条件的结果集的总行数；而count(字段)，则表示返回满足条件的数据行里面，参数“字段”为是NULL的总个数。

分析性能差异时的原则

分析性能差别的时候，记住几个原则：

server 层要什么就给什么；
InnoDB只给必要的值；
现在的优化器只优化了count(*)的语义为“取行数”，其他“显而易见”的优化并没有做。

count(主键)和count(1)的性能分析

对于count(主键)来说，InnoDB引擎会遍历整张表，把每一行的id值都取出来，返回给server层。server 层拿到id后，判断是不可能为空的，就按行累加。
对于count(1)来说，InnoDB引擎遍历整张表，但不取值。server 层对于返回的每一行，放一个数据“1”进去，判断是不可能为空的，按行累加。

单看这两个用法的差别的话，你能对比出来，count(1)执行得要比count(主键)快。因为从引擎返回id会涉及到解析数据行，以及拷贝字段值的操作。

count(字段)的性能分析

对于count(字段)来说：

如果这个“字段”是定义为Not null的话，一行行地从记录里面读出这个字段，判断不能为null, 按行累加；
如果这个“字段”定义为允许为Null，那么执行的时候，判断到有可能是Null, 还要把值取出来再判断一下，不是Null 才累加。
也就是前面的第一条原则：server层要什么字段，InnoDB就返回什么字段。

专门优化过的的count(*)

但是count(*)是例外，并不会把全部字段取出来，而是专门做了优化，不取值。
count(*) 肯定不是null, 按行累加。
看到这里，我们会想，优化器就不能自己判断一下吗？
主键肯定非空啊，为什么不能按照count(*)来处理，多么简单的优化啊。
当然，MySQL 专业针对这个语句进行优化，也是可以的（但实际上并没有针对这个语句进行优化）。但是这种需要专门优化的情况太多了，而且MySQL 已经优化为count(*)了，你就直接使用这种用法就可以了。

带

结论

所以最终的结论：按照效率从低到高排序的话，count(字段) < count(主键) < count(1) < count(*)
所以取表的行数的话，建议请尽量使用count(*)。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

不用的count用法

不用的count用法

讨论背景

分析性能差异时的原则

count(主键)和count(1)的性能分析

count(字段)的性能分析

专门优化过的的count(*)

结论

高效率使用windows

智能决策新时代：可视化大屏是否能够超越传统白板？

解密Prompt系列28. LLM Agent之金融领域摸索：FinMem & FinAgent

分享几个.NET开源的AI和LLM相关项目框架

不用的count用法

KMP算法中next函數的解析

女人要對自己狠一點

假期小窺

For循環的執行流程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結