Mysql性能優化：爲什麼count(*)這麼慢？

原創

2020-04-19 03:32

導讀

在開發中一定會用到統計一張表的行數，比如一個交易系統，老闆會讓你每天生成一個報表，這些統計信息少不了sql中的count函數。
但是隨着記錄越來越多，查詢的速度會越來越慢，爲什麼會這樣呢？Mysql內部到底是怎麼處理的？
今天這篇文章將從Mysql內部對於count函數是怎樣處理的來展開詳細的講述。

count的實現方式

在Mysql中的不同的存儲引擎對count函數有不同的實現方式。
MyISAM引擎把一個表的總行數存在了磁盤上，因此執行count(*)的時候會直接返回這個數，效率很高（沒有where查詢條件）。
InnoDB引擎並沒有直接將總數存在磁盤上，在執行count(*)函數的時候需要一行一行的將數據讀出來，然後累計總數。

爲什麼InnoDB不將總數存起來？

說到InnoDB相信讀者總會想到其支持事務的特性，事務具有隔離性，如果將總數存起來，怎麼保證各個事務之間的總數的一致性呢？不明白的看下圖：
事務A和事務B中的count(*)的執行結果是不同的，因此InnoDB引擎在每個事務中返回多少行是不確定的，只能一行一行的讀出來用來判斷總數。

如何提升count效率

在InnoDB對於如何提升count(*)的查詢效率，網上有多種解決辦法，這裏主要介紹三種，並分析可行性。

show table status

show table status這個命令能夠很快的查詢出數據庫中每個表的行數，但是真的能夠替代count(*)嗎？
答案是不能。原因很簡單，這個命令統計出來的值是一個「估值」，因此是不準確的，官方文檔說誤差大概在40%-50%。
因此這種方法直接pass，不準確還用它幹嘛。

緩存系統存儲總數

這種方法也是最容易想到的，增加一行就+1，刪除一行就-1，並且緩存系統讀取也是很快，既簡單又方便的爲什麼不用？
緩存系統和Mysql是兩個系統，比如redis和Mysql這兩個是典型的比較。兩個系統最難的就是在高併發下無法保證數據的一致性。通過以下兩圖我們來理解一下：
通過上面兩張圖，無論是redis計數+1還是insert into user先執行，最終都會導致數據在邏輯上的不一致。第一張圖會出現redis計數少了，第二張圖雖然計數正確了但是並沒有查詢出插入的那一行數據。
在併發系統裏面，我們是無法精確控制不同線程的執行時刻的，因爲存在圖中的這種操作序列，所以，我們說即使Redis正常工作，這個計數值還是邏輯上不精確的。

在數據庫保存計數

通過緩存系統保存的分析得知了使用緩存無法保證數據在邏輯上的一致性，因此我們想到了直接使用數據庫來保存，有了「事務」的支持，也就保證了數據的一致性了。
如何使用呢？很簡單，直接將計數保存在一張表中（table_name,total）。
至於執行的邏輯只需要將緩存系統中redis計數+1改成total字段+1即可，如下圖：
由於在同一個事務中，保證了數據在邏輯上的一致性。

不同count的用法

count()是一個聚合函數，對於返回的結果集，一行行地判斷，如果count函數的參數不是NULL，累計值就加1，否則不加。最後返回累計值。
count的用法有多種，分別是count(*)、count(字段)、count(1)、count(主鍵id)。那麼多種用法，到底有什麼差別呢？當然，「前提是沒有where條件語句」。
count(id)：InnoDB引擎會遍歷整張表，把每一行的id值都取出來，返回給server層。server層拿到id後，判斷是不可能爲空的，就按行累加。
count(1)：InnoDB引擎遍歷整張表，但不取值。server層對於返回的每一行，放一個數字1進去，判斷是不可能爲空的，按行累加。
count(字段)：

如果這個“字段”是定義爲not null的話，一行行地從記錄裏面讀出這個字段，判斷不能爲null，按行累加；
如果這個字段定義允許爲null，那麼執行的時候，判斷到有可能是null，還要把值取出來再判斷一下，不是null才累加。

count(*)：不會把全部字段取出來，而是專門做了優化，不取值。count(*)肯定不是null，按行累加。
所以結論很簡單：「按照效率排序的話，count(字段)<count(主鍵id)<count(1)≈count(*)，所以建議讀者，儘量使用count(*)。」
「注意」：這裏肯定有人會問，count(id)不是走的索引嗎，爲什麼查詢效率和其他的差不多呢？陳某在這裏解釋一下，雖然走的索引，但是還是要一行一行的掃描才能統計出來總數。

總結

MyISAM表雖然count(*)很快，但是不支持事務；
show table status命令雖然返回很快，但是不準確；
InnoDB直接count(*)會遍歷全表(沒有where條件)，雖然結果準確，但會導致性能問題。
緩存系統的存儲計數雖然簡單效率高，但是無法保證數據的一致性。
數據庫保存計數很簡單，也能保證數據的一致性，建議使用。
「思考題，讀者留言區討論」：在系統高併發的情況下，使用數據庫保存計數，是先更新計數+1,還是先插入數據。即是先update total+=1還是先insert into。

留言討論區

往期推薦

一條SQL查詢語句是如何執行的？Mysql性能優化：爲什麼要用覆蓋索引？Mysql性能優化：什麼是索引下推？Mysql中的三類鎖，你知道嗎？Mysql性能優化：如何給字符串加索引？

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

關於線程池優雅關閉

使用線程池的問題程序關閉時（eg. 上線），線程池中的任務會丟失（內存中）。線程池優雅關閉利用Spring中ContextClosedEvent：關閉程序觸發的事件，在使用線程池的地方，可以將線程池註冊到ThreadPoolShutd

帥氣的濤啊

2024-05-22 14:32:00

layui laydate日期時間範圍，時間默認設定爲23:59:59

在Layui中，如果你想設置日期時間選擇器（datetime）的默認結束時間爲當天的23:59:59，你可以使用如下代碼（紅色部分）：　　　　　　laydate.render({ elem: '#test

2024-05-22 14:30:20

Milvus向量數據庫入門實踐

Milvus是一個開源的向量數據庫，可以處理萬億級向量相似性搜索和分析。非結構化數據呈爆炸式增長。而我們可以通過機器學習模型，將非結構化數據轉化爲 embedding 向量，隨後處理分析這些數據。在此過程中，向量數據庫應運而生。向量

2024-05-22 14:29:39

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

本篇參考： https://help.salesforce.com/s/articleView?id=release-notes.rn_apex_5level_SOQLqueries.htm&release=250&type=5 http

2024-05-22 14:29:09

通過撰寫代碼理解向量計算，並用於文本分類

一、原生向量代碼，自己計算距離 import numpy as npfrom numpy import dotfrom numpy.linalg import normfrom sentence_transformers import Se

2024-05-22 14:23:18

一款開源的.NET程序集反編譯、編輯和調試神器

前言說到.NET相關的反編譯工具大家腦海裏第一個想到的工具是什麼？ILSpy、dnSpy、還是dotPeek？咱們今天的主要內容是講講dnSpyEx（dnSpyEx是dnSpy項目的非官方Fork維護版本）這個開源的.NET程序集反編譯、

2024-05-22 14:21:58

「Python實用祕技17」快速獲取國內節假日安排

本文完整示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/PythonPracticalSkills 　　這是我的系列文章「Python實用祕技」的第17期，本系列立足於筆者日常工作中使

2024-05-22 14:21:38

FolkMq v1.4.6 發佈（可以內嵌的消息中間件）

功能簡表角色功能生產者（客戶端）發佈消息、定時消息（或叫延時）、順序消息、可過期消息、事務消息。支持 Qos0、Qos1 消費者（客戶端）訂閱、取消訂閱。消費-ACK（自動、手動）服務端發

2024-05-22 14:21:18

霍夫變換和霍夫直線檢測的原理

張博的博客

2024-05-22 14:19:57

兩個線段距離的一個定理證明和代碼實現.

複雜度O(1) #計算兩個線段之間的最短距離: #暴力遍歷兩邊所有點求點之間距離最小速度N方. import cv2,math def jiajiao(line1, line2): line1with_x_axis=math.at

張博的博客

2024-05-22 14:19:57

kimi- MarkMap 生成思維導圖

1、Prompt：幫我分析《被人討厭的勇氣》這本書，從裏面總結出核心內容，要求: 1.提供 5 個主要觀點 2.每個觀點至少有 3 個支撐觀點說明 3.按照以下格式，使用markdown的代碼快格式輸出: ``` # 被人討厭的勇氣 ##

2024-05-22 14:14:57

Kimi 高效使用技巧，80%的人都不知道

Kimi 高效使用技巧，80%的人都不知道聚焦於 AI提示詞 + 職場提效。標題可能誇大或與內容不符 34 人贊同了該文章關注我, AI 學習之旅上，我與您一同成長！一、引言 Kimi 作

2024-05-22 14:14:57

keycloak~自定義認證流設置固定redirect_uri

redirect_uri在keycloak進行認證成功之後，會重定向到這個目標頁面，一般爲用戶的來源頁，即你在登錄之前訪問的頁面；自定義認證流是指對keycloak中的brower和direct grant兩個認證方式的過程添加自定義策略，

2024-05-22 14:12:37

power 740 p740 連接遠程管理模塊

https://111.111.111.111/ The connection for this site is not secure 111.111.111.111 uses an unsupported protocol.

2024-05-22 14:10:26

hdu4348（主席樹區間修改）

Problem - 4348 (hdu.edu.cn) BackgroundTo The Moon是一款獨立遊戲，於2011年11月發佈，是一款由RPG Maker提供支持的角色扮演冒險遊戲。《去月球》的前提是基於一種技術，該技術使我們能

2024-05-22 14:10:26

24小時熱門文章

最新文章

最新評論文章