COUNT函數暗藏玄機

1.前言

在數據庫操作中統計操作經常用到。
關於數據庫中行數統計,大家一定會想到COUNT函數,但這個函數卻暗藏着玄機。

2.常見問題

  • COUNT有幾種用法 ?
  • COUNT(字段名)和COUNT(*)的查詢結果有什麼不同 ?
  • COUNT(1)和COUNT(*)之間有什麼不同 ?
  • COUNT(1)和COUNT(*)之間的效率哪個更高 ?
  • 爲什麼《阿里巴巴Java開發手冊》建議使用COUNT(*) ?

3.函數介紹

3.1 初識COUNT

關於COUNT函數,MySQL官網中是這樣介紹的:
image.png
簡譯:

  • COUNT(expr) ,返回SELECT語句檢索的行中expr的值不爲NULL的數量。結果是一個BIGINT值。
  • 如果查詢結果沒有命中任何記錄,則返回0
  • 但是,值得注意的是,COUNT(*) 的統計結果中,會包含值爲NULL的行數。

3.2 測試一下

3.2.1 創建測試表

CREATE TABLE `count_test` (
  `id` int(10) NOT NULL AUTO_INCREMENT COMMENT '自增ID',
  `id_one` int(10) DEFAULT NULL COMMENT 'ID1',
  `id_two` int(10) DEFAULT NULL COMMENT 'ID2',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='count 測試表';

3.2.2 初始化測試數據

INSERT INTO `count_test`
(`id`, `id_one`, `id_two`) 
VALUES 
(1, NULL, 1),
(2, NULL, 1),
(3, 1, NULL),
(4, 1, 1),
(5, NULL, 1);

使用count(*),count(id),count(id_one),count(id_two):

SELECT
	count( * ),
	count( id ),
	count( id_one ),
	count( id_two ) 
FROM
	count_test;

3.2.2 測試結果與結論

image.png
count(*) 查詢的是表中所有總行數 ;
count(id) 查詢的是表中id不爲空的記錄總行數 ;
count(id_one) 查詢的是表中id_one不爲空的記錄總行數 ;
count(id_two) 查詢的是表中id_two不爲空的記錄總行數 ;

3.3 用法間的區別

3.3.1 COUNT有幾種用法 ?

  • COUNT(expr)用於做行數統計,統計的是expr不爲NULL的行數 ;
  • COUNT(常量) 和 COUNT(*)表示的是直接查詢符合條件的數據庫表的行數 ;
  • COUNT(列名)表示的是查詢符合條件的列的值不爲NULL的行數 ;

3.3.2 COUNT(*)與COUNT(常量)

COUNT(*)與COUNT(常量)

  • COUNT(1)和COUNT(*)之間有什麼不同?
  • COUNT(1)和COUNT(*)之間的效率哪個更高?
  • 爲什麼《阿里巴巴Java開發手冊》建議使用COUNT(*)

image.png

3.3.3 COUNT(*)和COUNT(1)

衆說紛紜

  • 有的說COUNT(*)執行時會轉換成COUNT(1),所以COUNT(1)少了轉換步驟,所以更快。
  • 還有的說,因爲MySQL針對COUNT()做了特殊優化,所以COUNT()更快。

那麼,到底哪種說法是對的呢?
MySQL官方文檔
image.png

簡譯重點:

  • 在InnoDB引擎下 same way , no performance difference ;

3.3.4 其它用法

1.去重統計
COUNT(DISTINCT expr,[expr…])

SELECT count( DISTINCT id_one ) FROM count_test;

4.擴展篇

MySQL中常用的執行引擎就是InnoDB和MyISAM,count函數在InnoDB和MyISAM引擎下的區別?
常見問題

  • MySQL的MyISAM引擎對COUNT(*)做了哪些優化?
  • MySQL的InnoDB引擎對COUNT(*)做了哪些優化?
  • MySQL對COUNT(*)做的優化,有一個關鍵的前提是什麼?

MyISAM和InnoDB有很多區別

  • MyISAM不支持事務;
  • MyISAM中的鎖是表級鎖;
  • InnoDB支持事務,並且支持行級鎖,本文主要講count函數的區別。


MyISAM引擎下count

  • 因爲MyISAM引擎下的鎖是表級鎖,所以同一張表的操作是串行的,MyISAM做了一個簡單的優化,把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的總數,當然,前提是不能有where條件
  • MyISAM可以把表中的總行數記錄下來供COUNT(*)查詢使用,那是因爲MyISAM數據庫是表級鎖,不會有併發的數據庫行數修改,所以查詢得到的行數是準確的。


InnoDB引擎下的count
但是,對於InnoDB來說,就不能做這種緩存操作了,因爲InnoDB支持事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被併發修改,那麼緩存記錄下來的總行數就不準確了。
但是,在InnoDB中,使用COUNT()查詢行數的時候,不可避免的要進行掃表了,InnoDB還是針對COUNT()語句做了些優化的。說白了就是索引


InnoDB引擎下的count優化
MySQ對COUNT語句,做了一部分優化。但前提是查詢語句中不包含WHERE或GROUP BY等條 ;

索引提速
COUNT(*)的目的只是爲了統計總行,所以,如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間 。

InnoDB中索引分爲聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。
所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。所以,當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的。

參考資料:官網介紹傳送門

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章