大家都在用MySQL count(*)統計總數，到底有什麼問題？

-Advertisement-

在日常開發工作中，我經常會遇到需要統計總數的場景，比如：統計訂單總數、統計用戶總數等。一般我們會使用MySQL 的count函數進行統計，但是隨著數據量逐漸增大，統計耗時也越來越長，最後竟然出現慢查詢的情況，這究竟是什麼原因呢？本篇文章帶你一下學習一下。 ...

在日常開發工作中，我經常會遇到需要統計總數的場景，比如：統計訂單總數、統計用戶總數等。一般我們會使用MySQL 的count函數進行統計，但是隨著數據量逐漸增大，統計耗時也越來越長，最後竟然出現慢查詢的情況，這究竟是什麼原因呢？本篇文章帶你一下學習一下。

1. MyISAM存儲引擎計數為什麼這麼快？

我們總有個錯覺，就是感覺MyISAM引擎的count計數要比InnoDB引擎更快，實際這不是錯覺。

MyISAM引擎把表的總行數單獨記錄在磁碟上，查詢的時候可以直接返回，不需要再累加統計。

但是當SQL查詢中有where條件的時候，就無法再使用表的總行數了，還是需要乖乖的進行累加統計，查詢性能也就跟InnoDB相差無幾了。

為什麼MyISAM引擎能夠記錄表的總行數，InnoDB引擎卻不行？

因為MyISAM引擎不支持事務，只有表鎖，所以記錄的總行數是準確的。

而InnoDB引擎支持事務和行鎖，存在併發修改的情況。又由於事務的隔離性，會出現不可重覆讀和幻讀，記錄的總行數無法保證是準確的。

2. 能不能手動實現統計總行數

既然InnoDB引擎沒有幫我們記錄總行數，我們能不能手動記錄總行數，比如使用Redis。

其實也是不行的，使用Redis記錄總行數，至少有下麵3個問題：

無法實現事務之間的隔離
更新丟失，因為i++不是原子操作，當然可以使用Lua腳本實現原子操作，更複雜。
Redis是非關係型緩存資料庫，不能當作關係型持久化資料庫使用，一般需要設置過期時間。

由上圖中得知，雖然Redis計數加1操作放在了事務裡面，但是不受事務控制的，在事務沒有提交前，其他查詢依然讀到了最新的總行數，這就是臟讀的情況。

3. InnoDB引擎能否實現快速計數

有一種辦法，可以粗略估計表的總行數，就是使用MySQL命令：

show table status like 'user';

真實的總行數有100萬行，預估有99萬多行，誤差在可接受的範圍內。

部分場景適用，比如粗略估計網站的總用戶數。

4. 四種計數方式的性能差別

常見的統計總行數的方式有以下四種：

count(*) 、 count(常量) 、 count(id) 、 count(欄位)

InnoDB引擎對count計數做了優化，會選用數據量較小的非聚簇索引進行統計。

比如用戶表中有三個索引，分別是主鍵索引、name索引和age索引，使用執行計劃查看計數的時候用到了哪個索引？

CREATE TABLE `user` (
  `id` int NOT NULL AUTO_INCREMENT COMMENT '主鍵',
  `name` varchar(100) DEFAULT NULL COMMENT '姓名',
  `age` tinyint NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`),
  KEY `idx_age` (`age`)
) ENGINE=InnoDB COMMENT='用戶表';

explain select count(*) from user;

用到了數據量較小的age索引。

count(*) 、 count(常量) 是直接統計表中的總行數，效率較高。

而 count(id) 還需要把數據返回給MySQL Server端進行累加計數。

最後 count(欄位)需要篩選不為null欄位，效率最差。

四種計數的查詢性能從高到低，依次是：

count(*) ≈ count(常量) > count(id) > count(欄位)

對於大多數情況，得到計數結果，還是老老實實使用count(*)

所以推薦使用select count(*)，別跟**select *搞混了，不推薦使用select ***的。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Go 語言學習系列(一) : Get started with Go

安裝 go https://go.dev/doc/install 安裝以後命令行執行 go version 然後隨便創建一個文件, 比如 hello.go package main import "fmt" func main() { fmt.Println("hello world!") } 這就 ...
C# 使用SIMD向量類型加速浮點數組求和運算（2）：C#通過Intrinsic直接使用AVX指令集操作 Vector256<T>，及C++程式對比

本文技術方案支持.Net/.Net Core/.Net Framework 數據分頁，幾乎是任何應用系統的必備功能。但當數據量較大時，分頁操作的效率就會變得很低。大數據量分頁時，一個操作耗時5秒、10秒、甚至更長時間都是有可能的，但這在用戶使用的角度是不可接受的…… 數據分頁往往有三種常用方案。第 ...
/dev/null文件的作用以及使用方法

關於/dev/null，以及如何使用它今天在看MIT的一個課程時，老師給的程式實例中有一個地方沒弄明白： #!/bin/bash echo "Starting program at $(date)" # Date will be substituted echo "Running program ...
源碼安裝apache腳本部署

源碼安裝apache腳本部署 [root@localhost ~]# ls anaconda-ks.cfg httpd.tar.xz [root@localhost ~]# tar xf httpd.tar.xz 解壓存放腳本的壓縮包 [root@localhost ~]# ls anaconda- ...
LRTimelapse for Mac(專業延時攝影渲染工具)

lrTimelapse for Mac是MAC OS上的一款視頻編輯軟體，lrTimelapse mac是一款配合 Adobe Lightroom、Adobe Camera RAW 和 Adobe After Effects 等程式製作延時攝影的軟體。lrtimelapse mac將帶你到下一個水平 ...
sed語句用法

sed高階用法 sed編輯器 sed是一種流編輯器，流編輯器會在編輯器處理數據之前基於預先提供的一組規則來編輯數據流。 1.sed編輯器工作流程 sed編輯器可以根據命令來處理數據流中的數據，這些命令要麼從命令行中輸入，要麼存儲在一個命令文本文件中。 sed的工作流程主要包括讀取、執行和顯示三個過程 ...
Java學習-第一部分-第三階段-第三節：MySQL基礎

零基礎學MySQL 筆記目錄：(https://www.cnblogs.com/wenjie2000/p/16378441.html) 一個問題淘寶網，京東、微信，抖音都有各自的功能,那麼當我們退出系統的時候，下次再訪問時，為什麼信息還存在? =》資料庫解決之道-文件、資料庫為瞭解決上述問題， ...
MySQL實現備份案例（2）

案例1：MySQL8.0實現資料庫冷備份和還原 10.0.0.10 -- MySQL8.0 #停止資料庫 [root@CentOS8 my.cnf.d]# systemctl stop mysqld.service #備份數據 [root@CentOS8 ~]# scp -pr /var/lib/m ...