MySQL中的全表掃描和索引樹掃描

-Advertisement-

引言在學習mysql時，我們經常會使用explain來查看sql查詢的索引等優化手段的使用情況。在使用explain時，我們可以觀察到，explain的輸出有一個很關鍵的列，它就是type屬性，type表示的是掃描方式，代表 MySQL 使用了哪種索引類型，不同的索引類型的查詢效率是不一樣的。在 ...

引言

在學習mysql時，我們經常會使用explain來查看sql查詢的索引等優化手段的使用情況。在使用explain時，我們可以觀察到，explain的輸出有一個很關鍵的列，它就是type屬性，type表示的是掃描方式，代表 MySQL 使用了哪種索引類型，不同的索引類型的查詢效率是不一樣的。

在type這一列，有如下一些可能的選項：

system：系統表，少量數據，往往不需要進行磁碟IO
const：常量連接
eq_ref：主鍵索引(primary key)或者非空唯一索引(unique not null)等值掃描
ref：非主鍵非唯一索引等值掃描
range：範圍掃描
index：索引樹掃描
ALL：全表掃描(full table scan)

在上面列出的7種選項中，前面五種我就不詳細講了，可以參考Mysql Explain之type詳解這篇文章。我當時對於前五種屬性是比較容易就理解了的，但是對於後面兩種即索引樹掃描和全表掃描我還是存在一些疑問。

索引樹掃描我們是比較熟悉的，它就是會遍歷聚簇索引樹，底層是一顆B+樹，葉子節點存儲了所有的實際行數據。其實，全表掃描也是掃描的聚簇索引樹，因為聚簇索引樹的葉子節點中存儲的就是實際數據，只要掃描遍歷聚簇索引樹就可以得到全表的數據了。

那索引樹掃描和全表掃描究竟有什麼區別呢？

以下將以一個實例來詳細分析這兩種掃描方式的區別。

實例

我們建立一張t_article表：

create table t_article(
    t_article_id int primary key auto_increment,
    t_title varchar(40),
);

在我們創建的t_article表中，只有兩個欄位，一個是主鍵t_article_id，另一個是普通欄位t_title。

我們知道，InnoDB會將聚簇索引預設建立在主鍵上，而聚簇索引樹中的葉子節點就存儲了整張表的行數據。

接著，我們分別設計兩個sql查詢case：

走主鍵索引

explain SELECT t_article_id FROM t_article;

走全表掃描：
```
explain SELECT t_title FROM t_article;
```

以上兩個查詢都沒有where查詢，按理來說底層的sql執行情況應該是差不多的。

結果分析

我們可以來看看上面兩種查詢的結果，在查詢時使用explain語句輸出sql執行的詳細信息。

走索引掃描

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	t_article		index		PRIMARY	4		2	100	Using index

走全表掃描

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	t_article		ALL					2	100

從以上兩個查詢結果中我們可以發現，走主鍵索引的查詢和走全表的查詢是不一樣的。我們前面也提到了，InnoDB的索引是使用B+樹來實現的，而主鍵索引中存儲了整張表的數據，那全表掃描時其實也是掃描的主鍵索引。那為什麼這兩種查詢會不一樣呢？按理來說都是查詢的主鍵索引，它們應該是一樣的。

其實，它們兩者是有一些細節區別的。

比如，第一個查詢，它的優化手段是使用索引樹掃描，也就是type中顯示的index屬性，而且它還使用了覆蓋索引，即Extra列中的Using index屬性。之所以第一個查詢能夠使用這兩種優化手段，其實是因為select查詢的結果列只包含主鍵，而主鍵的值是可以直接在遍歷聚簇索引樹時確定，也不需要回表查詢了。

對於第二個查詢，它也沒有使用where進行過濾，而且它的select結果列包含的是普通列，並不是主鍵或者其他索引列，所以它會走全表掃描。而全表掃描其實底層也是掃描的聚簇索引樹，也就是底層的B+樹。這種全表掃描與索引樹掃描有一個明顯區別，那就是，全表掃描不僅僅需要掃描索引列，還需要掃描每個索引列中指向的實際數據，這裡包含了所有的非索引列數據。

前面的分析可能還是有點生硬和難以理解，具體地，我們通過下麵一張圖來更直觀地看一下：

圖片源自:從數據頁的角度看 B+ 樹

從上面的圖我們可以看到，對於索引掃描來講，它只需要讀取葉子節點的所有key，也就是索引的鍵，而不需要讀取具體的data行數據；而對於全表掃描來說，它無法僅僅通過讀取索引列獲得需要的數據，還需要讀取具體的data數據才能獲取select中指定的非索引列的具體值。所以，全表掃描的效率相比於索引樹掃描相對較低一點，但是差距不是很大。

參考

【mysql】全表掃描過程 & 聚簇索引區別和聯繫
 從數據頁的角度看 B+ 樹

Either Excellent or Rusty

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

WPF|如何在 WPF 中設計漂亮的社交媒體信息儀錶板

1. 效果展示先來直接欣賞效果： 2. 準備創建一個WPF工程，比如站長使用 .NET 7 創建名為 Dashboard3 的WPF項目，添加一些圖片資源，項目目錄如下： 2.1 圖片資源可在網站 iconfont 下載關閉、最小化圖標，用於視窗右上角顯示：有看到美女圖片沒？在百度圖片或 ...
windbg的時間旅行實現對 C# 程式的終極調試

一：什麼是時間旅行簡而言之就是把程式的執行流拍成vlog，這樣就可以對 vlog 快進或者倒退，還可以分享給別人做進一步的分析，是不是想都不敢想。很開心的是 windbg preview 版本中已經實現了，叫做時間旅行調試 TTD，相比傳統的靜態分析不知道好多少倍。為了能提起大家興趣，我 ...
WPF|分享一個登錄界面設計

分享一個登錄界面，先看效果圖：準備文中使用到了一些圖標：我們可以從 iconfont免費下載：代碼簡單說明請隨手創建一個WPF項目（.NET Framework、.NET 5\6\7皆可），使用tree /f命令看看最終的文件結構，和上面的截圖一致： C:. │ ModernLoginPa ...
[ Module ] 環境變數管理工具 Module 安裝和使用

Environment Modules: provides dynamic modification of a user's environment 一個可以動態修改用戶環境的工具 ...
linux_ll命令

ll命令 ll命令顯示的參數如下是對每一列的參數的解釋第一列為文件類型參數符號類型 "-" 普通文件 "d" 是個目錄文件 "l" 鏈接文件 "p" 管道文件 "b" 設備文件 "c" 字元設備文件 "s" 套接字文件普通文件類型最常使用的一類文件，其特點是不包含有文件系統信息的結構信息 ...
使用NE555實現的延時開關電路

NE555 的電氣特性 555系列有幾種不同的規格 NE555是民用版本, 推薦的工作溫度是 0 - 70 NA555, SA555, SE555 是工業版本, 推薦工作溫度為 -40 - 100 電壓: 最高18V, 推薦工作電壓15V以內電流: Pin3 輸出電流支持 ±225 mA, 推薦的 ...
電機雜訊之諧波分析（內附simulink中FFT分析的相關參數配置與解析）

電機雜訊之諧波分析（內附simulink中FFT分析的相關參數配置與解析）寫在前面宿舍持續隔離中，快遞停運，沒法搞實踐，那就搞點模擬（我才不會說是導師讓我乾的呢[手動doge]）正文電機雜訊一開始我覺得，電機雜訊不就是因為電機運轉起來之後，轉子不停的旋轉引起的震動，因而產生的雜訊。後來證 ...
Linux：查看磁碟配額報告數據

近期在超算雲上跑代碼遇到了個烏龍，就是作業一提交到集群上去先是PD狀態，然後馬上就終止調了。後來知道是我用戶目錄下文件數量太多，導致已經超過管理員給我分配的磁碟配額了（眾所周知機器學習相關項目的數據集一般有很多文件）。這邊特此記錄一下如何查看磁碟配額數據。超算用的是Lustre文件系統，該系統是一種... ...