MySQL索引查詢原理

来源:https://www.cnblogs.com/winner192/archive/2019/10/27/11747509.html
-Advertisement-
Play Games

什麼是索引? “索引”是為了能夠更快地查詢數據。比如一本書的目錄,就是這本書的內容的索引,讀者可以通過在目錄中快速查找自己想要的內容,然後根據頁碼去找到具體的章節。 資料庫也是一樣,如果查詢語句使用到了索引,會先去索引裡面查詢,取得數據所在行的物理地址,進而訪問數據。 索引的優缺點 優勢:以快速檢索 ...


什麼是索引?

“索引”是為了能夠更快地查詢數據。比如一本書的目錄,就是這本書的內容的索引,讀者可以通過在目錄中快速查找自己想要的內容,然後根據頁碼去找到具體的章節。 資料庫也是一樣,如果查詢語句使用到了索引,會先去索引裡面查詢,取得數據所在行的物理地址,進而訪問數據。 索引的優缺點 優勢:以快速檢索,減少I/O次數,加快檢索速度;根據索引分組和排序,可以加快分組和排序; 劣勢:索引本身也是表,因此會占用存儲空間。索引的維護和創建需要時間成本,這個成本隨著數據量增大而增大;構建索引會降低數據表的修改操作(刪除,添加,修改)的效率,因為在修改數據表的同時還需要修改索引表。
  索引的分類 在MySQL中,常見的索引類型有:主鍵索引、唯一索引、普通索引、全文索引、組合索引。創建語法分別為:
圖片

  其中,組合索引又稱為多列索引,上述代碼中最後一個例子就是建立了3列的索引。MySQL在根據索引查詢時,會遵循“最左匹配”原則,即先根據col1的條件查,再根據col2的條件查,然後再根據col3的條件去查。 如果跳過了一個列直接查後面的列,比如下麵的語句,就不能使用上面創建的索引了: 圖片

  這裡有一個小技巧,如果你前面的列是一個簡單的枚舉類型,比如性別等,可以用在where語句中加 col1 in(MALE, FEMALE) 來“跳過” col1 列,並使用上述索引。   對於某列如果是字元串且比較長(比如UUID),推薦使用首碼索引,即匹配前n個字元。具體這個n取值多少是根據你的數據來的,通過使用 LEFT 函數查詢,從1開始,不斷增加n的值,直到查詢結果的行數接近完整列的查詢結果的行數,就是合適的n的值。  圖片

索引的實現原理

MySQL的索引是由存儲引擎來實現的。由於存儲引擎不同,所以具有不同的索引類型,如BTree索引,B+Tree索引,哈希索引,全文索引等。這裡由於主要介紹BTree索引和B+Tree索引,我們平時使用最多的InnoDB引擎就是基於B+Tree索引的。   目前版本的MySQL InnoDB引擎已經支持全文索引,但不支持中文,可以通過使用ngram插件開始支持中文。   從二叉搜索樹開始
  瞭解過數據結構的應該知道一種叫二叉樹的數據結構。二叉樹根據用途不同,衍生了不同的變種,比如堆,比如二叉搜索樹。
  而二叉搜索樹中,為了防止極端情況樹的高度過大影響查詢效率,所以衍生出了一些平衡二叉查找樹,最典型的就是AVL和紅黑樹。
  但二叉樹在數據量較大時,深度過深,不太適合資料庫的查詢,所以資料庫使用了多叉樹。
  BTree

BTree(又稱為B-Tree)是一個平衡搜索多叉樹。BTree的結構如下圖:
圖片
    設樹的度為2d(d>1),高度為h,那麼BTree有以下性質:   每個葉子結點的高度一樣,等於h; 每個非葉子結點由n-1個key和n個指針組成,key和指針相互隔離,結點兩端一定是key; 葉子結點指針為null; 非葉子結點的key都是[key,data]二元組,其中key表示作為索引的鍵,data為鍵值所在行的其它列的數據;   在BTree中,對索引列是順序存儲的,所以很適合查找範圍數據和ORDER BY操作。
  B+Tree
  B+Tree是BTree的一種變種。B+Tree和BTree的不同主要在於:   B+Tree中的非葉子結點不存儲數據,只存儲鍵值; B+Tree的葉子結點沒有指針,所有鍵值都會出現在葉子結點上,且key存儲的鍵值對應data數據的物理地址; B+Tree的每個非葉子節點由n個鍵值key和n個指針point組成;   結構圖: 圖片


B+Tree對比BTree的優點:
  一般來說B+Tree比BTree更適合實現外存的索引結構,因為存儲引擎的設計專家巧妙的利用了外存(磁碟)的存儲結構。
  磁碟的最小存儲單位是扇區(sector),而操作系統的塊(block)通常是整數倍的sector,操作系統以頁(page)為單位管理記憶體,一頁(page)通常預設為4K,資料庫的頁通常設置為操作系統頁的整數倍,因此索引結構的節點被設計為一個頁的大小,然後利用外存的“預讀取”原則,每次讀取的時候,把整個節點的數據讀取到記憶體中,然後在記憶體中查找。
  已知記憶體的讀取速度是外存讀取I/O速度的幾百倍,那麼提升查找速度的關鍵就在於儘可能少的磁碟I/O,那麼可以知道,每個節點中的key個數越多,那麼樹的高度越小,需要I/O的次數越少,因此一般來說B+Tree比BTree更快,因為B+Tree的非葉節點中不存儲data,就可以存儲更多的key。
  帶順序索引的B+Tree
  一般在資料庫系統或文件系統中使用的B+Tree結構都在經典B+Tree的基礎上進行了優化,增加了順序訪問指針。
圖片

在B+Tree的每個葉子節點增加一個指向相鄰葉子節點的指針,就形成了帶有順序訪問指針的B+Tree。做這個優化的目的是為了提高區間訪問的性能,例如如果要查詢key為從18到49的所有數據記錄,當找到18後,只需順著節點和指針順序遍歷就可以一次性訪問到所有數據節點,不用從頭再查詢一次,極大提到了區間查詢效率。
  聚簇索引和非聚簇索引
  MySQL中最常見的兩種存儲引擎分別是MyISAM和InnoDB,分別實現了非聚簇索引和聚簇索引。
  前段時間看到一個問題:“你知道為什麼InnoDB非主鍵索引普遍比主鍵索引要慢嗎?”答案是InnoDB使用了聚簇索引,主鍵索引主需要查詢一次,而非主鍵索引需要查詢兩次。
  為什麼非主鍵索引需要查詢兩次呢?且看接下來的內容。
  主索引與輔助索引
  首先介紹一下基礎的概念。在索引的分類中,我們可以按照索引的鍵是否為主鍵來分為“主索引”和“輔助索引”,使用主鍵鍵值建立的索引稱為“主索引”,其它的稱為“輔助索引”。因此主索引只能有一個,輔助索引可以有很多個。
  為什麼需要用到輔助索引?因為前面我們介紹了,查詢語句如果想要使用索引,是需要滿足最左匹配原則的。有時候我們的查詢並不會使用到主鍵列,所以需要在其它列建立索引,即輔助索引。
  非聚簇索引
  非聚簇索引的主索引和輔助索引幾乎是一樣的,只是主索引不允許重覆,不允許空值,他們的葉子結點的key都存儲指向鍵值對應的數據的物理地址。
  非聚簇索引的數據表和索引表是分開存儲的。非聚簇索引中的數據是根據數據的插入順序保存。因此非聚簇索引更適合單個數據的查詢。插入順序不受鍵值影響。
  聚簇索引
  聚簇索引的主索引的葉子結點存儲的是鍵值對應的數據本身,輔助索引的葉子結點存儲的是鍵值對應的數據的主鍵鍵值。因此主鍵的值長度越小越好,類型越簡單越好。
  聚簇索引的數據和主鍵索引存儲在一起。
  聚簇索引的數據是根據主鍵的順序保存。因此適合按主鍵索引的區間查找,可以有更少的磁碟I/O,加快查詢速度。但是也是因為這個原因,聚簇索引的插入順序最好按照主鍵單調的順序插入,否則會頻繁的引起頁分裂(BTree插入時的一個操作),嚴重影響性能。 在InnoDB中,如果只需要查找索引的列,就儘量不要加入其它的列,這樣會提高查詢效率。   聚簇索引與非聚簇索引的區別: 圖片 對於很多資料庫的索引原理的分析還有查找判斷方案還有很多細節的東西,鑒於實際問題比較多,可以加QQ:647617935 進行交流

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [TOC] 1. 埠號 在同一臺主機或設備上,可能有多個進程同時在使用TCP或UDP協議,埠號的作用就是區分這些不同的進程,即每個進程使用各自不同的埠號。 對於TCP協議和UDP協議,埠號都是用unsigned short類型表示,即埠號的範圍為0 65535,這65536個埠號被分為3 ...
  • 一.centos的安裝 centos分為桌面版本和命令版本;在這裡我使用的是命令版本,因為這個版本比較小,推薦使用電腦配置不高的使用centos命令版本。 這裡選擇安裝程式光碟映像文件,文件就是centos7的iso文件。 虛擬機的名稱和位置自行設置; 虛擬機的記憶體根據自己電腦的配置設置,我這裡設置 ...
  • Linux操作系統 linux系統的主要構成: 1、硬體交互層:系統的底層,為內核層提供基礎,由管理外圍設備的軟體構成(外設包括終端控制器和存儲設備控制器) 2、內核層:系統核心,包括進程管理和文件子系統 3、系統介面層:實現操作系統命令,視窗系統和系統函數的調用功能,為應用層提供命令介面,圖形介面 ...
  • Linux常用命令 Linux常用的目錄操作命令 pwd 命令查看用戶的當前目錄 cd 改變當前路徑 cd 絕對路徑或者相對路徑 cd ~ 切換到當前用戶的宿主目錄 cd - 切換到上一次所在的目錄 cd .. 上一級目錄 ls 命令顯示文件或目錄信息 mkdir 創建目錄 -p 創建嵌套的多級目錄 ...
  • 一、單端、全差分、偽差分 此部分轉載https://www.cnblogs.com/alifpga/p/7976531.html 單端信號: 單端信號(single-end)是相對於差分信號而言的,單端輸入指信號有一個參考端和一個信號端構成,參考端一般為地端。 差分信號: 差分(Differenti ...
  • COUNT全表記錄 在MySQL中,相同的SQL不同的存儲引擎執行計劃不同: 現有測試表TB101: 對於沒有WHERE條件的COUNT(*)/COUNT(1)/COUNT(ID)/COUNT(C1)的執行計劃為: 對於沒有WHERE條件的COUNT(C2)的執行計劃為: 可以發現,對於MyISAM ...
  • Redis持久化 RDB快照 在預設情況下,Redis將記憶體資料庫快照保存到dump.rdb的二進位文件中。 可以對Redis進行設置,讓它在“N秒內數據集至少有N個改動”, 這一條件被滿足時,自動保存一次數據集。比如說:讓Redis滿足“60秒內至少有1000個鍵被改動”這一個條件時,自動保存一次 ...
  • 一、上線規劃 一般 redis 的參數配置都在 redis.conf 中,在上線前根據實際環境配置好合適參數,能有效提高 redis 的可用性。 redis 的運行機器 CPU 不求核數多,但求主頻高,Cache大,因為 redis 主處理模式是單進程的。 留意 redis 日誌文件的配置,對應 l ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...