MySQL中的全表掃描和索引樹掃描

来源:https://www.cnblogs.com/GarrettWale/archive/2022/05/14/16271622.html
-Advertisement-
Play Games

引言 在學習mysql時,我們經常會使用explain來查看sql查詢的索引等優化手段的使用情況。在使用explain時,我們可以觀察到,explain的輸出有一個很關鍵的列,它就是type屬性,type表示的是掃描方式,代表 MySQL 使用了哪種索引類型,不同的索引類型的查詢效率是不一樣的。 在 ...


引言

在學習mysql時,我們經常會使用explain來查看sql查詢的索引等優化手段的使用情況。在使用explain時,我們可以觀察到,explain的輸出有一個很關鍵的列,它就是type屬性,type表示的是掃描方式,代表 MySQL 使用了哪種索引類型,不同的索引類型的查詢效率是不一樣的。

在type這一列,有如下一些可能的選項:

  • system:系統表,少量數據,往往不需要進行磁碟IO
  • const:常量連接
  • eq_ref:主鍵索引(primary key)或者非空唯一索引(unique not null)等值掃描
  • ref:非主鍵非唯一索引等值掃描
  • range:範圍掃描
  • index:索引樹掃描
  • ALL:全表掃描(full table scan)

在上面列出的7種選項中,前面五種我就不詳細講了,可以參考Mysql Explain之type詳解這篇文章。我當時對於前五種屬性是比較容易就理解了的,但是對於後面兩種即索引樹掃描和全表掃描我還是存在一些疑問。

索引樹掃描我們是比較熟悉的,它就是會遍歷聚簇索引樹,底層是一顆B+樹,葉子節點存儲了所有的實際行數據。其實,全表掃描也是掃描的聚簇索引樹,因為聚簇索引樹的葉子節點中存儲的就是實際數據,只要掃描遍歷聚簇索引樹就可以得到全表的數據了。

那索引樹掃描和全表掃描究竟有什麼區別呢?

以下將以一個實例來詳細分析這兩種掃描方式的區別。

實例

我們建立一張t_article表:

create table t_article(
    t_article_id int primary key auto_increment,
    t_title varchar(40),
);

在我們創建的t_article表中,只有兩個欄位,一個是主鍵t_article_id,另一個是普通欄位t_title

我們知道,InnoDB會將聚簇索引預設建立在主鍵上,而聚簇索引樹中的葉子節點就存儲了整張表的行數據。

接著,我們分別設計兩個sql查詢case:

  1. 走主鍵索引
    explain SELECT t_article_id FROM t_article;
    
  2. 走全表掃描:
    explain SELECT t_title FROM t_article;
    

以上兩個查詢都沒有where查詢,按理來說底層的sql執行情況應該是差不多的。

結果分析

我們可以來看看上面兩種查詢的結果,在查詢時使用explain語句輸出sql執行的詳細信息。

  1. 走索引掃描
id select_type table partitions type possible_keys key key_len ref rows filtered Extra
1 SIMPLE t_article index PRIMARY 4 2 100 Using index
  1. 走全表掃描
id select_type table partitions type possible_keys key key_len ref rows filtered Extra
1 SIMPLE t_article ALL 2 100

從以上兩個查詢結果中我們可以發現,走主鍵索引的查詢和走全表的查詢是不一樣的。我們前面也提到了,InnoDB的索引是使用B+樹來實現的,而主鍵索引中存儲了整張表的數據,那全表掃描時其實也是掃描的主鍵索引。那為什麼這兩種查詢會不一樣呢?按理來說都是查詢的主鍵索引,它們應該是一樣的。

其實,它們兩者是有一些細節區別的。

比如,第一個查詢,它的優化手段是使用索引樹掃描,也就是type中顯示的index屬性,而且它還使用了覆蓋索引,即Extra列中的Using index屬性。之所以第一個查詢能夠使用這兩種優化手段,其實是因為select查詢的結果列只包含主鍵,而主鍵的值是可以直接在遍歷聚簇索引樹時確定,也不需要回表查詢了。

對於第二個查詢,它也沒有使用where進行過濾,而且它的select結果列包含的是普通列,並不是主鍵或者其他索引列,所以它會走全表掃描。而全表掃描其實底層也是掃描的聚簇索引樹,也就是底層的B+樹。這種全表掃描與索引樹掃描有一個明顯區別,那就是,全表掃描不僅僅需要掃描索引列,還需要掃描每個索引列中指向的實際數據,這裡包含了所有的非索引列數據。

前面的分析可能還是有點生硬和難以理解,具體地,我們通過下麵一張圖來更直觀地看一下:

image
圖片源自:從數據頁的角度看 B+ 樹

從上面的圖我們可以看到,對於索引掃描來講,它只需要讀取葉子節點的所有key,也就是索引的鍵,而不需要讀取具體的data行數據;而對於全表掃描來說,它無法僅僅通過讀取索引列獲得需要的數據,還需要讀取具體的data數據才能獲取select中指定的非索引列的具體值。所以,全表掃描的效率相比於索引樹掃描相對較低一點,但是差距不是很大。

參考

【mysql】全表掃描過程 & 聚簇索引 區別和聯繫
從數據頁的角度看 B+ 樹

Either Excellent or Rusty
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. 效果展示 先來直接欣賞效果: 2. 準備 創建一個WPF工程,比如站長使用 .NET 7 創建名為 Dashboard3 的WPF項目,添加一些圖片資源,項目目錄如下: 2.1 圖片資源 可在網站 iconfont 下載 關閉、最小化 圖標,用於視窗右上角顯示: 有看到美女圖片沒?在百度圖片或 ...
  • 一:什麼是時間旅行 簡而言之就是把程式的執行流拍成vlog,這樣就可以對 vlog 快進或者倒退,還可以分享給別人做進一步的分析,是不是想都不敢想。 很開心的是 windbg preview 版本中已經實現了,叫做 時間旅行調試 TTD,相比傳統的 靜態分析 不知道好多少倍。 為了能提起大家興趣,我 ...
  • 分享一個登錄界面,先看效果圖: 準備 文中使用到了一些圖標: 我們可以從 iconfont免費下載: 代碼簡單說明 請隨手創建一個WPF項目(.NET Framework、.NET 5\6\7皆可),使用tree /f命令看看最終的文件結構,和上面的截圖一致: C:. │ ModernLoginPa ...
  • Environment Modules: provides dynamic modification of a user's environment 一個可以動態修改用戶環境的工具 ...
  • ll命令 ll命令顯示的參數 如下是對每一列的參數的解釋 第一列為文件類型 參數符號 類型 "-" 普通文件 "d" 是個目錄文件 "l" 鏈接文件 "p" 管道文件 "b" 設備文件 "c" 字元設備文件 "s" 套接字文件 普通文件類型 最常使用的一類文件,其特點是不包含有文件系統信息的結構信息 ...
  • NE555 的電氣特性 555系列有幾種不同的規格 NE555是民用版本, 推薦的工作溫度是 0 - 70 NA555, SA555, SE555 是工業版本, 推薦工作溫度為 -40 - 100 電壓: 最高18V, 推薦工作電壓15V以內 電流: Pin3 輸出電流支持 ±225 mA, 推薦的 ...
  • 電機雜訊之諧波分析(內附simulink中FFT分析的相關參數配置與解析) 寫在前面 宿舍持續隔離中,快遞停運,沒法搞實踐,那就搞點模擬(我才不會說是導師讓我乾的呢[手動doge]) 正文 電機雜訊 一開始我覺得,電機雜訊不就是因為電機運轉起來之後,轉子不停的旋轉引起的震動,因而產生的雜訊。 後來證 ...
  • 近期在超算雲上跑代碼遇到了個烏龍,就是作業一提交到集群上去先是PD狀態,然後馬上就終止調了。後來知道是我用戶目錄下文件數量太多,導致已經超過管理員給我分配的磁碟配額了(眾所周知機器學習相關項目的數據集一般有很多文件)。這邊特此記錄一下如何查看磁碟配額數據。超算用的是Lustre文件系統,該系統是一種... ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...