重新認識MySQL中的COUNT語句

来源:https://www.cnblogs.com/muzhuang/archive/2019/11/06/11803246.html

在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作。 而在所有查詢操作中,統計數量操作更是經常被用到。 關於資料庫中行數統計,無論是MySQL還是Oracle亦或者是SqlServer,都有一個函數可以使用,那就是COUNT。 而對於COUNT,有幾個問題很值得去思考: 1、COUNT有幾種用法? ...


在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作。

而在所有查詢操作中,統計數量操作更是經常被用到。

關於資料庫中行數統計,無論是MySQL還是Oracle亦或者是SqlServer,都有一個函數可以使用,那就是COUNT。

而對於COUNT,有幾個問題很值得去思考:

1、COUNT有幾種用法?

2、COUNT(欄位名)和COUNT()的查詢結果有什麼不同?

3、COUNT(1)和COUNT()之間有什麼不同?

4、COUNT(1)和COUNT()之間的效率哪個更高?

5、為什麼《阿裡巴巴Java開發手冊》建議使用COUNT()

6、MySQL的MyISAM引擎對COUNT()做了哪些優化?

7、MySQL的InnoDB引擎對COUNT()做了哪些優化?

8、上面提到的MySQL對COUNT()做的優化,有一個關鍵的前提是什麼?

9、SELECT COUNT() 的時候,加不加where條件有差別嗎?

10、COUNT()、COUNT(1)和COUNT(欄位名)的執行過程是怎樣的?

如果以上10道題,全部準確無誤的回答的話,那說明你真的很瞭解COUNT函數了,如果有哪些知識點是不瞭解的,那麼本文正好可以重新幫你認識一下Count,也為資料庫優化做一些思考。

認識COUNT

關於COUNT函數的介紹:

1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數量。結果是一個BIGINT值。

2、如果查詢結果沒有命中任何記錄,則返回0

3、但是,值得註意的是,COUNT() 的統計結果中,會包含值為NULL的行數。

例:

create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)

使用語句count(),count(id),count(id2)查詢結果如下:

select count(),count(id),count(id2)
from #bla
results 7 3 2

除了COUNT(id)和COUNT()以外,還可以使用COUNT(常量)(如COUNT(1))來統計行數,那麼這三條SQL語句有什麼區別呢?

到底哪種效率更高呢?

為什麼《阿裡巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代COUNT()呢?

重新認識MySQL中的COUNT語句

COUNT(列名)、COUNT(常量)和COUNT()之間的區別

前面我們提到過COUNT(expr)用於做行數統計,統計的是expr不為NULL的行數,那麼COUNT(列名)、 COUNT(常量) 和 COUNT()這三種語法中,expr分別是列名、 常量 和 。

那麼列名、 常量 和 這三個條件中,常量是一個固定值,肯定不為NULL。

可以理解為查詢整行,所以肯定也不為NULL,那麼就只有列名的查詢結果有可能是NULL了。

所以, COUNT(常量) 和 COUNT()表示的是直接查詢符合條件的資料庫表的行數。

而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數。

除了查詢得到結果集有區別之外,COUNT()相比COUNT(常量) 和 COUNT(列名)來講,COUNT()是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL資料庫對他進行過很多優化。

SQL92,是資料庫的一個ANSI/ISO標準。

它定義了一種語言(SQL)以及資料庫的行為(事務、隔離級別等)。

COUNT()的優化

前面提到了COUNT()是SQL92定義的標準統計行數的語法,所以MySQL資料庫對他進行過很多優化。

那麼,具體都做過哪些事情呢?

這裡的介紹要區分不同的執行引擎。

MySQL中比較常用的執行引擎就是InnoDB和MyISAM。MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT()有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;

而InnoDB支持事務,並且支持行級鎖。

因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串列進行,所以,MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT()進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。

MyISAM之所以可以把表中的總行數記錄下來供COUNT()查詢使用,那是因為MyISAM資料庫是表級鎖,不會有併發的資料庫行數修改,所以查詢得到的行數是準確的。

但是,對於InnoDB來說,就不能做這種緩存操作了,因為InnoDB支持事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被併發修改,那麼緩存記錄下來的總行數就不准確了。

但是,InnoDB還是針對COUNT()語句做了些優化的。

在InnoDB中,使用COUNT()查詢行數的時候,不可避免的要進行掃表了,那麼,就可以在掃表過程中下功夫來優化效率了。

從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT() FROM tblname語句,確實在掃表的過程中做了一些優化。

前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道,COUNT()的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,他如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間。

我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。

所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。

當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的。

至此,我們介紹完了MySQL資料庫對於COUNT()的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。

COUNT()和COUNT(1)

介紹完了COUNT(),接下來看看COUNT(1),對於,這二者到底有沒有區別,網上的說法眾說紛紜。

有的說COUNT()執行時會轉換成COUNT(1),所以COUNT(1)少了轉換步驟,所以更快。

還有的說,因為MySQL針對COUNT()做了特殊優化,所以COUNT()更快。

那麼,到底哪種說法是對的呢?

看下MySQL官方文檔是怎麼說的:

InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點:

same way , no performance difference。

所以,對於COUNT(1)和COUNT(),MySQL的優化是完全一樣的,根本不存在誰比誰快!

那既然COUNT()和COUNT(1)一樣,建議用哪個呢?

建議使用COUNT()!

因為這個是SQL92定義的標準統計行數的語法,而且本文只是基於MySQL做了分析,關於Oracle中的這個問題,也是眾說紛紜的呢。

COUNT(欄位)

最後,就是我們一直還沒提到的COUNT(欄位),他的查詢就比較簡單粗暴了,就是進行全表掃描,然後判斷指定欄位的值是不是為NULL,不為NULL則累加。相比COUNT(),COUNT(欄位)多了一個步驟就是判斷所查詢的欄位是否為NULL,所以他的性能要比COUNT()慢。

總結

本文介紹了COUNT函數的用法,主要用於統計表行數。

主要用法有COUNT()、COUNT(欄位)和COUNT(1)。

因為COUNT()是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT()查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中COUNT()和COUNT(1)實現上沒有區別,而且效率一樣,但是COUNT(欄位)需要進行欄位的非NULL判斷,所以效率會低一些。

因為COUNT()是SQL92定義的標準統計行數的語法,並且效率高,所以請直接使用COUNT()查詢表的行數!*

本文來自木莊網路博客> 重新認識MySQL中的COUNT語句


您的分享是我們最大的動力!

更多相關文章
  • elastic search 集群新增node 同一臺物理機 ...
  • [Err] 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '(0... ...
  • 說來和MySQL倒是有緣,畢業的第一份工作就被分配到了RDS團隊,主要負責把MySQL弄到雲上做成資料庫服務。雖說整天和MySQL打交道,但說實話那段時間並沒有很深入的理解MySQL內核,做的事情基本都是圍繞著MySQL做管控系統,比較上層。好在周邊都是MySQL內核神級人物,在他們的熏陶下多多少少 ...
  • 初次使用redis時,在鏈接Redis後,運行報錯“No module named redis”。 具體代碼如下: import redis r = redis.Redis(host='192.168.2.22',port=6379,db=2) r.set('name','Delia') print ...
  • mysql不支持全連接,但可以通過左外連接+ union+右外連接實現 ...
  • 1、什麼是mysql主從同步? 當master(主)庫的數據發生變化的時候,變化會實時的同步到slave(從)庫。 2、主從同步有什麼好處? 水平擴展資料庫的負載能力。 容錯,高可用。Failover(失敗切換)/High Availability 數據備份。 3、主從同步的原理是什麼? 首先我們來 ...
  • 今天用mysql執行了一個60M的SQL腳本遇到了一些錯誤,經由網上查詢如下: 1.#2006 - MySQL server has gone away 出現該錯誤代碼原因如下: 1、應用程式長時間的執行批量的MySQL語句。 2、執行一個SQL,但SQL語句過大或者語句中含有BLOB或者longb ...
  • Made By Herolh 目錄 { index} [TOC] 一、MySQL是什麼: 服務端 客戶端 Mysql資料庫 Mysql是最流行的關係型資料庫管理系統,在 WEB 應用方面MySQL是最好的RDBMS(Relational Database Management System:關係數據 ...
一周排行
  • C#6.0新特性 C#7.0新特性 C#8.0新特性 ...
  • out變數 可以直接在方法中使用out申明變數 int.TryParse("123", out var result); 元組 元組的申明 var alphaBetaStart = (alpha: "a", beta: "b"); Console.WriteLine($"{alphaBetaStar ...
  • 在我們的項目中,通常會把數據存儲到關係型資料庫中,比如Oracle,SQL Server,Mysql等,但是關係型資料庫對於併發的支持並不是很強大,這樣就會造成系統的性能不佳,而且存儲的數據多為結構化數據,對於非結構數據(比如文本)和半結構化數據(比如JSon) 就顯得不夠靈活,而非關係型資料庫則很 ...
  • 這幾天終於弄懂了async和await的模式,也搞明白了一直在心裡面積壓著的許多問題,所以寫一篇博客來和大家分享一下。 關於非同步機制我認為只要記住的以下幾點,就可以弄明白了: 1.我認為async和awwait兩個修飾符中最關鍵的是await,async是由於方法中包含await修飾符之後才在方法定 ...
  • 實現WCF的步驟如下: 設計服務協議 實現服務協議 配置服務 托管服務 生成客戶端(這步可有可無) 設計或定義服務協議要麼使用介面,要麼使用類。建議介面,使用介面好處一堆例如修改介面的實現,但是服務協定有無需改變。 設計服務協議,介面上使用 ServiceContractAttribute ,方法上 ...
  • 什麼鬼,我的CPF快寫好了,你居然也要搞跨平臺UI框架?什麼Maui? 之前怎麼不早說要搞跨平臺UI框架呢?看到谷歌搞flutter眼紅了?明年年底發佈?又搞這種追別人屁股的爛事情。 什麼MVU模式?模仿Dart?用C#代碼直接寫UI的模式和我的CPF很像啊。 當初我考慮過XML,Json來描述UI ...
  • 寫在前面 Docker作為開源的應用容器引擎,可以讓我們很輕鬆的構建一個輕量級、易移植的容器,通過Docker方式進行持續交付、測試和部署,都是極為方便的,並且對於我們開發來說,最直觀的優點還是解決了日常開發中的環境配置與部署環境配置上的差異所帶來的種種疑難雜症,從此推脫產品的措辭也少了——“我電腦 ...
  • 一、前言 回顧:認證授權方案之授權初識 從上一節中,我們在對授權系統已經有了初步的認識和使用,可以發現,asp.net core為我們提供的授權策略是一個非常強大豐富且靈活的認證授權方案,能夠滿足大部分的授權場景。 在ConfigureServices中配置服務:將授權服務添加到容器 public ...
  • 項目背景: 工作之餘兼職一家公司(方向是工業4.0)給做IM系統,主要功能包括:文字、 圖片、文件傳輸、遠程協助、視頻語音等等。這些功能都是基於群會話, 比如工廠操作工人遇到問題,請求遠程專家,這個初級專家不能解決問題,會邀請一個高級專家進來解決。開發過程中主要遇到的問題是視頻和語音這一塊,像其他的... ...
  • 基礎概念 Microsoft中間語言(MSIL),也成為通用中間語言(CIL),是一組與平臺無關的指令,由特定於語言的編譯器從源代碼生成。MSIL是獨立於平臺的,因此,他可以在任何公共語言基礎架構支持特定的環境上執行。 通過JIT編譯器將MSIL轉換為特定電腦環境的特定機器代碼。這是在執行MSIL ...