count(*)、count(主键id)、count(字段)、count(1)实现原理和性能比较

原創

jack1liu

2020-06-27 04:23

在工作中我们或多或少都会遇到统计数据的需求，那么问题来了，count(*)、count(主键id)、count(字段)、count(1) 这些操作，我们到底用哪个比较合适呢。

count() 的语义

count() 是一个聚合函数，对于返回的结果集，一行行地判断，如果 count 函数的参数不是 NULL，累计值就加 1，否则不加。最后返回累计值。

MySQL 不同引擎，count()的实现方式

MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(*) 的时候会直接返回这个数，效率很高；
InnoDB 引擎，它执行 count() 的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数。

我们以 InnoDB 引擎进行分析：

**count(*)**

InnoDB 是索引组织表，主键索引树的叶子节点是数据，而普通索引树的叶子节点是主键值。所以，普通索引树比主键索引树小很多。对于 count(*) 这样的操作，遍历哪个索引树得到的结果逻辑上都是一样的。因此，MySQL 优化器会找到最小的那棵树来遍历。在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。

count(主键id)

InnoDB 引擎会遍历整张表，把每一行的 id 值都取出来，返回给 server 层。server 层拿到 id 后，判断是不为空的，就按行累加。

count(1)

InnoDB 引擎遍历整张表，但不取值。server 层对于返回的每一行，放一个数字“1”进去，判断是不为空的，按行累加。

count(字段)

如果这个“字段”是定义为 not null 的话，一行行地从记录里面读出这个字段，判断不能为 null，按行累加；
如果这个“字段”定义允许为 null，那么执行的时候，判断到有可能是 null，还要把值取出来再判断一下，不是 null 才累加。

count(1) 执行得要比 count(主键 id) 快。因为从引擎返回 id 会涉及到解析数据行，以及拷贝字段值的操作。

所以结论是：按照效率排序的话，count(字段)<count(主键 id)<count(1)≈count(*)，所以我建议你，尽量使用 count(*)。

参考文档

https://time.geekbang.org/column/article/72775

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

count(*)、count(主键id)、count(字段)、count(1)实现原理和性能比较

count() 的语义

MySQL 不同引擎，count()的实现方式

**count(*)**

count(主键id)

count(1)

count(字段)

参考文档

CPU 利用率高如何分析

06. 重構-簡化條件表達式

JMH 性能測試分析工具

Redis 過期策略、內存淘汰機制和 LRU 算法的實現

04. 重構-在對象之間搬移特性

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結