MySQL的COUNT語句，80%的程序員都沒弄懂！

數據庫查詢相信很多人都不陌生，所有經常有人調侃程序員就是CRUD專員，這所謂的CRUD指的就是數據庫的增刪改查。

在數據庫的增刪改查操作中，使用最頻繁的就是查詢操作。而在所有查詢操作中，統計數量操作更是經常被用到。

關於數據庫中行數統計，無論是MySQL還是Oracle，都有一個函數可以使用，那就是COUNT

但是，就是這個常用的COUNT函數，卻暗藏着很多玄機，尤其是在面試的時候，一不小心就會被虐。不信的話請嘗試回答下以下問題：

1、COUNT有幾種用法？

2、COUNT(字段名)和COUNT(*)的查詢結果有什麼不同？

3、COUNT(1)和COUNT(*)之間有什麼不同？

4、COUNT(1)和COUNT(*)之間的效率哪個更高？

5、爲什麼《阿里巴巴Java開發手冊》建議使用COUNT(*)

6、MySQL的MyISAM引擎對COUNT(*)做了哪些優化？

7、MySQL的InnoDB引擎對COUNT(*)做了哪些優化？

8、上面提到的MySQL對COUNT(*)做的優化，有一個關鍵的前提是什麼？

9、SELECT COUNT(*) 的時候，加不加where條件有差別嗎？

10、COUNT(*)、COUNT(1)和COUNT(字段名)的執行過程是怎樣的？

以上10道題，如果您可以全部準確無誤的回答的話，那說明你真的很瞭解COUNT函數了，如果有哪些知識點是不瞭解的，那麼本文正好可以幫你答疑解惑。

認識COUNT

關於COUNT函數，在MySQL官網中有詳細介紹：

簡單翻譯一下：

1、COUNT(expr) ，返回SELECT語句檢索的行中expr的值不爲NULL的數量。結果是一個BIGINT值。

2、如果查詢結果沒有命中任何記錄，則返回0

3、但是，值得注意的是，COUNT(*) 的統計結果中，會包含值爲NULL的行數。

即以下表記錄

create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)

使用語句count(*),count(id),count(id2)查詢結果如下：

select count(*),count(id),count(id2)
from #bla
results 7 3 2

除了COUNT(id)和COUNT(*)以外，還可以使用COUNT(常量)（如COUNT(1)）來統計行數，那麼這三條SQL語句有什麼區別呢？到底哪種效率更高呢？爲什麼《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代 COUNT(*)呢？

**COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別**

前面我們提到過COUNT(expr)用於做行數統計，統計的是expr不爲NULL的行數，那麼COUNT(列名)、 COUNT(常量) 和 COUNT(*)這三種語法中，expr分別是列名、 常量 和 *。

那麼列名、 常量 和 *這三個條件中，常量 是一個固定值，肯定不爲NULL。*可以理解爲查詢整行，所以肯定也不爲NULL，那麼就只有列名的查詢結果有可能是NULL了。

所以， COUNT(常量) 和 COUNT(*)表示的是直接查詢符合條件的數據庫表的行數。而COUNT(列名)表示的是查詢符合條件的列的值不爲NULL的行數。

除了查詢得到結果集有區別之外，COUNT(*)相比COUNT(常量) 和 COUNT(列名)來講，COUNT(*)是SQL92定義的標準統計行數的語法，因爲他是標準語法，所以MySQL數據庫對他進行過很多優化。

SQL92，是數據庫的一個ANSI/ISO標準。它定義了一種語言（SQL）以及數據庫的行爲（事務、隔離級別等）。

**COUNT(*)的優化**

前面提到了COUNT(*)是SQL92定義的標準統計行數的語法，所以MySQL數據庫對他進行過很多優化。那麼，具體都做過哪些事情呢？

這裏的介紹要區分不同的執行引擎。MySQL中比較常用的執行引擎就是InnoDB和MyISAM。

MyISAM和InnoDB有很多區別，其中有一個關鍵的區別和我們接下來要介紹的COUNT(*)有關，那就是MyISAM不支持事務，MyISAM中的鎖是表級鎖；而InnoDB支持事務，並且支持行級鎖。

因爲MyISAM的鎖是表級鎖，所以同一張表上面的操作需要串行進行，所以，MyISAM做了一個簡單的優化，那就是它可以把表的總行數單獨記錄下來，如果從一張表中使用COUNT(*)進行查詢的時候，可以直接返回這個記錄下來的數值就可以了，當然，前提是不能有where條件。

MyISAM之所以可以把表中的總行數記錄下來供COUNT(*)查詢使用，那是因爲MyISAM數據庫是表級鎖，不會有併發的數據庫行數修改，所以查詢得到的行數是準確的。

但是，對於InnoDB來說，就不能做這種緩存操作了，因爲InnoDB支持事務，其中大部分操作都是行級鎖，所以可能表的行數可能會被併發修改，那麼緩存記錄下來的總行數就不準確了。

但是，InnoDB還是針對COUNT(*)語句做了些優化的。

在InnoDB中，使用COUNT(*)查詢行數的時候，不可避免的要進行掃表了，那麼，就可以在掃表過程中下功夫來優化效率了。

從MySQL 8.0.13開始，針對InnoDB的SELECT COUNT(*) FROM tbl_name語句，確實在掃表的過程中做了一些優化。前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道，COUNT(*)的目的只是爲了統計總行數，所以，他根本不關心自己查到的具體值，所以，他如果能夠在掃表的過程中，選擇一個成本較低的索引進行的話，那就可以大大節省時間。

我們知道，InnoDB中索引分爲聚簇索引（主鍵索引）和非聚簇索引（非主鍵索引），聚簇索引的葉子節點中保存的是整行記錄，而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。

所以，相比之下，非聚簇索引要比聚簇索引小很多，所以MySQL會優先選擇最小的非聚簇索引來掃表。所以，當我們建表的時候，除了主鍵索引以外，創建一個非主鍵索引還是有必要的。

至此，我們介紹完了MySQL數據庫對於COUNT(*)的優化，這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。

**COUNT(*)和COUNT(1)**

介紹完了COUNT(*)，接下來看看COUNT(1)，對於，這二者到底有沒有區別，網上的說法衆說紛紜。

有的說COUNT(*)執行時會轉換成COUNT(1)，所以COUNT(1)少了轉換步驟，所以更快。

還有的說，因爲MySQL針對COUNT(*)做了特殊優化，所以COUNT(*)更快。

那麼，到底哪種說法是對的呢？看下MySQL官方文檔是怎麼說的：

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點：same way , no performance difference。所以，對於COUNT(1)和COUNT(*)，MySQL的優化是完全一樣的，根本不存在誰比誰快！

那既然COUNT(*)和COUNT(1)一樣，建議用哪個呢？

建議使用COUNT(*)！因爲這個是SQL92定義的標準統計行數的語法，而且本文只是基於MySQL做了分析，關於Oracle中的這個問題，也是衆說紛紜的呢。

COUNT(字段)

最後，就是我們一直還沒提到的COUNT(字段)，他的查詢就比較簡單粗暴了，就是進行全表掃描，然後判斷指定字段的值是不是爲NULL，不爲NULL則累加。

相比COUNT(*)，COUNT(字段)多了一個步驟就是判斷所查詢的字段是否爲NULL，所以他的性能要比COUNT(*)慢。

總結

本文介紹了COUNT函數的用法，主要用於統計表行數。主要用法有COUNT(*)、COUNT(字段)和COUNT(1)。

因爲COUNT(*)是SQL92定義的標準統計行數的語法，所以MySQL對他進行了很多優化，MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)查詢，而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然，這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中COUNT(*)和COUNT(1)實現上沒有區別，而且效率一樣，但是COUNT(字段)需要進行字段的非NULL判斷，所以效率會低一些。

因爲COUNT(*)是SQL92定義的標準統計行數的語法，並且效率高，所以請直接使用COUNT(*)查詢表的行數！

參考資料：

https://dev.mysql.com/doc/refman/8.0/en/group-by-functions.html#function_count

《極客時間——MySQL實戰45講》

MySQL的COUNT語句，80%的程序員都沒弄懂！

**COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別**

**COUNT(*)的優化**

**COUNT(*)和COUNT(1)**

COUNT(字段)

總結

爲什麼要⽤ Foundry

【筆記】動手學深度學習-預備知識

py發送email

MySQL 分庫分表方案，總結太全了。。

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

WPF開源輕便、快速的桌面啓動器

公司來了個新同事，把 DDD 運用得爐火純青！

關於 CodeReview 的一些思考

你解決的問題，比你寫的代碼更重要！

MySQL的COUNT語句，80%的程序員都沒弄懂！

面試官：談談你對mysql索引的認識？

面試官系列：緩存雪崩、擊穿、穿透？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結