count(1) 比 count(*) 效果高,我被鄙視了

MySQL count(1) 真的比 count(*) 快麼?

你也一直和我一樣認爲 count(1) 真的比 count(*) 快麼 ?突然有一天和同事聊這個事情,被狠狠的鄙視了一把。

那麼你自己研究過沒? 如果我告訴你他們一樣,你信麼?

有 Where 條件的 count ,會根據掃碼結果 count 一下所有的行數,其性能更依賴於你的 Where 條件,所以文章我們僅針對沒有 Where 的情況進行說明。

MyISAM 引擎會把一個表的總行數記錄了下來,所以在執行 count() 的時候會直接返回數量,執行效率很高。在 MySQL 5.5 以後默認引擎切換爲 InnoDB,InnoDB 因爲增加了版本控制(MVCC)的原因,同時有多個事務訪問數據並且有更新操作的時候,每個事務需要維護自己的可見性,那麼每個事務查詢到的行數也是不同的,所以不能緩存具體的行數,他每次都需要 count 一下所有的行數。那麼 count(1) 和 count() 有區別麼?

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference. 這是官網的解釋,直接點擊 閱讀原文 查看官文,所以兩種實現其實一樣,那麼具體爲什麼一樣呢?

探究這個問題首先我們需要理解 count 的含義,如下是官網給出的定義

Returns a count of the number of non-NULL values of expr in the rows retrieved by a SELECT statement. The result is a BIGINT value.

大致的解釋是返回 SELECT 語句檢索的行中 expr 的非 NULL 值的計數,到這裏我們就明白了,首先它是一個聚合函數,然後對 SELECT 的結果集進行計數,但是需要參數不爲 NULL。那麼我們繼續閱讀官網的內容:

COUNT(*) is somewhat different in that it returns a count of the number of rows retrieved, whether or not they contain NULL values.

大致的內容是說,count() 不同,他不關心這個返回值是否爲空都會計算他的count,因爲 count(1) 中的 1 是恆真表達式,那麼 count() 還是 count(1) 都是對所有的結果集進行 count,所以他們本質上沒有什麼區別。

當然這個地方 InnoDB 本身也做了一些優化,它會使用最小的二級索引來進行 count 的查詢優化。如果沒有二級索引纔會選擇聚簇索引,這樣的設計單從 IO 的角度就節省了很多開銷。

到這裏我們明白了 count(*) 和 count(1) 本質上面其實是一樣的,那麼 count(column) 又是怎麼回事呢?

count(column) 也是會遍歷整張表,但是不同的是它會拿到 column 的值以後判斷是否爲空,然後再進行累加,那麼如果針對主鍵需要解析內容,如果是二級所以需要再次根據主鍵獲取內容,又是一次 IO 操作,所以 count(column) 的性能肯定不如前兩者嘍,如果按照效率比較的話: count(*)=count(1)>count(primary key)>count(column)

既然 count(*) 在查詢上依賴於所有的數據集,是不是我們在設計上也需要儘量的規避全量 count 呢?通常情況我們針對可預見的 count 查詢會做適當的緩存,可以是 Redis,也可以是獨立的 MySQL count 表,當然無論是哪種方式我們都需要考慮一致性的問題。

到這裏文章就結束了,你對 count() 有了重新的認識麼?

來源:https://www.tuicool.com/articles/vu267zu

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章