不用的count用法

讨论背景

在select count(?) from t 这样的查询语句里面,count(*), count(主键),count(字段)和count(1)在性能上有差别。
今天就详细记录一下,这几种用法的差别。
需要注意的是,此处的讨论是基于MySQL的InnoDB引擎的。

这里,首先要弄清楚count的语义。count()是一个聚合函数,对于返回的结果集合,一行行地判断,如果count函数的参数不是NULL, 累计值就加1,否则不加。最后返回累计值。
所以,count(*), count(主键)和count(1)都表示返回满足条件的结果集的总行数;而count(字段),则表示返回满足条件的数据行里面,参数“字段”为是NULL的总个数。

分析性能差异时的原则

分析性能差别的时候,记住几个原则:

  1. server 层要什么就给什么;
  2. InnoDB只给必要的值;
  3. 现在的优化器只优化了count(*)的语义为“取行数”,其他“显而易见”的优化并没有做。

count(主键)和count(1)的性能分析

对于count(主键)来说,InnoDB引擎会遍历整张表,把每一行的id值都取出来,返回给server层。server 层拿到id后,判断是不可能为空的,就按行累加。
对于count(1)来说,InnoDB引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数据“1”进去,判断是不可能为空的,按行累加。

单看这两个用法的差别的话,你能对比出来,count(1)执行得要比count(主键)快。因为从引擎返回id会涉及到解析数据行,以及拷贝字段值的操作。

count(字段)的性能分析

对于count(字段)来说:

  1. 如果这个“字段”是定义为Not null的话,一行行地从记录里面读出这个字段,判断不能为null, 按行累加;
  2. 如果这个“字段”定义为允许为Null,那么执行的时候,判断到有可能是Null, 还要把值取出来再判断一下,不是Null 才累加。
    也就是前面的第一条原则:server层要什么字段,InnoDB就返回什么字段。

专门优化过的的count(*)

但是count(*)是例外,并不会把全部字段取出来,而是专门做了优化,不取值。
count(*) 肯定不是null, 按行累加。
看到这里,我们会想,优化器就不能自己判断一下吗?
主键肯定非空啊,为什么不能按照count(*)来处理,多么简单的优化啊。
当然,MySQL 专业针对这个语句进行优化,也是可以的(但实际上并没有针对这个语句进行优化)。但是这种需要专门优化的情况太多了,而且MySQL 已经优化为count(*)了,你就直接使用这种用法就可以了。

结论

所以最终的结论:按照效率从低到高排序的话,count(字段) < count(主键) < count(1) < count(*)
所以取表的行数的话,建议请尽量使用count(*)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章