MySQL索引基礎

来源:https://www.cnblogs.com/yunxitalk/archive/2018/12/02/10053627.html
-Advertisement-
Play Games

介紹 索引用於加快數據訪問的速度。把電腦的磁碟比作一本字典,索引就是欄位的目錄,當我們想快速查到某個詞語的時候只需要通過查詢目錄找到詞語所在的頁數,然後直接打開某頁就可以。MySQL最常用的索引是B+樹索引,為什麼使用B+作為MySQL的索引,這是許多面試官必問的問題。 為什麼B+樹 硬體相關知識 ...


介紹

    索引用於加快數據訪問的速度。把電腦的磁碟比作一本字典,索引就是欄位的目錄,當我們想快速查到某個詞語的時候只需要通過查詢目錄找到詞語所在的頁數,然後直接打開某頁就可以。MySQL最常用的索引是B+樹索引,為什麼使用B+作為MySQL的索引,這是許多面試官必問的問題。

為什麼B+樹

硬體相關知識

    電腦的磁碟是一個圓盤的介面,圓盤上有一個個的圓圈,數據就是記錄在這些圓圈的扇區上。如下圖所示

當電腦系統讀取數據的時候要通過以下幾個步驟:
1、首先移動臂根據柱面號使磁頭移動到所需要的柱面上,這一過程被稱為尋道。所耗費的時間叫尋道時間(ts)。
2、目標扇區旋轉到磁頭下,這個過程耗費的時間叫旋轉時間。
    因此訪問磁碟的時間由三部分構成: 尋道時間+旋轉時間+數據傳輸時間 
第一部分尋道時間延遲最高,最大可達到100ms,旋轉時間取決於磁碟的轉速,轉速在7200轉/分鐘的磁碟平均旋轉時間在5ms左右。磁碟的讀取是以block(盤塊)為單位的,位於同一個盤塊的數據可以一次性讀取出來。在讀寫數據的時候儘量減少磁頭來回移動的次數,避免過多的查找時間。如果每次從磁碟上讀取數據的時候都要經歷上面的幾個過程那麼效率上無疑是極低的。

為什麼B+樹

    從上面可以看到,如果隨機訪問磁碟的速度是很慢的,因此需要設計一個合理的數據結構來減少隨機訪問磁碟的次數。B樹就是這樣一種數據結構。

B樹、B+樹介紹

B樹

    B樹是為存儲設備而設計的一種多叉平衡查找樹。它與紅黑樹類似,但是在降低IO操作方面B樹的表現要更好一些,B樹與紅黑樹最大的區別在於B樹可以有多個子節點,紅黑樹最多是有兩個子節點,這就決定了大多數情況下B樹的高度要比紅黑樹低很多,因此在查找的時候能夠降低IO次數。下圖是一棵B樹:

B 樹又叫平衡多路查找樹。一棵m階的B樹的特性如下:
    a.樹中每個結點最多含有m個孩子(m>=2);
    b.除根結點和葉子結點外,其它每個結點至少有[ceil(m / 2)]個孩子(其中ceil(x)是一個取上限的函數);
    c.若根結點不是葉子結點,則至少有2個孩子(特殊情況:沒有孩子的根結點,即根結點為葉子結點,整棵樹只有一個根節點);
    d.所有葉子結點都出現在同一層,葉子結點不包含任何關鍵字信息
    e.每個非終端結點中包含有n個關鍵字信息: (n,P0,K1,P1,K2,P2,......,Kn,Pn)。其中:
        a) Ki (i=1…n)為關鍵字,且關鍵字按順序升序排序K(i-1)< Ki。 
        b) Pi為指向子樹根的接點,且指針P(i-1)指向子樹種所有結點的關鍵字均小於Ki,但都大於K(i-1)。 
        c) 關鍵字的個數n必須滿足: [ceil(m / 2)-1]<= n <= m-1。
    B樹中的每個節點都儘可能存儲多的關鍵字信息和分支信息,但是不會超過磁碟塊的大小。這樣在有效降低了樹的高度,在查找的時候可以快速定位在指定的磁碟塊。假如要從上圖中找到79這個數字,首先從根節點開始掃描,79大於35所以選擇P3指針,指向磁碟塊4,在磁碟塊4中79在65和87之間,因此選擇P2指針,選擇磁碟塊10,這時候就可以從磁碟塊10中找到79。整個過程只需要3次IO,如果這棵樹被緩存在記憶體中,那麼只需要一次IO就可以讀到79這個數字。

B+樹

    B+樹是B的變種,一顆m階B+樹和m階B樹的異同點在於:
    1、有n棵子樹的節點中有n-1個關鍵字(與B樹n棵子樹有n-1個關鍵字,保持一致)
    2、所有的葉子節點中包含了全部的關鍵字的信息,以及指向含有這些關鍵字記錄的指針,且葉子節點本身依關鍵字的大小而自小而大順序鏈接(而B樹的葉子節點並沒有包含全部需要查找的信息)
    3、所有的非終端節點可以看成索引部分,節點中僅含有其子樹根節點中最大或者最小的關鍵字(而B樹的非終節點也要包含需要查找的有效信息)
    
由於B+樹的葉子節點是連接在一起的,因此相對於使用B樹作為索引,對於MySQL的範圍查詢更加優化。同時由於葉子節點包含所有關鍵字信息,因此有的查詢語句就不需要回表,只需要查詢索引就可以查到需要的數據。

索引類型

B樹索引

    雖然是叫B樹索引,但是資料庫實際上使用的是B+樹來組織數據。B樹索引意味著所有值都是按照順序存儲的,並且每個葉子節點到根節點的距離是相同的。
假如有如下數據表:

CREATE TABLE `people` (
  `last_name` varchar(50) DEFAULT NULL,
  `first_name` varchar(50) DEFAULT NULL,
  `dob` date DEFAULT NULL,
  `gender` enum('m','f') DEFAULT NULL,
  KEY `last_name` (`last_name`,`first_name`,`dob`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;


該表對last_name,first_name,dob三列建立了索引,索引的組織方式如下:

當同時對多列進行索引的時候,索引的順序是非常重要的,上面的索引首先是按照last_name進行索引,在last_name相同的情況下在對first_name進行排序,最後是dob欄位。
    B樹索引適用於全鍵值、鍵值範圍和最左首碼查找:
全鍵值
    查找名字為Allen Kim,出生日期為1930-07-12的人,這樣的查找方式匹配了索引中的所有欄位,依次掃描索引中的last_name、first_name和dob欄位,找到對應的數據。
鍵值範圍
    查找姓名在Allen和Barrymore之間的人,這種查找方式也會使用到索引。需要註意的是這裡只能是索引中的第一列,也就是last_name的範圍查找。
首碼匹配
    查找last_name是以Al開頭的人,這種查詢會以此掃描索引中的節點,然後選出來對應的複合條件的行。也是只能使用第一列的首碼查詢。如果是說想查first_name的首碼匹配,那麼是無法使用到索引的,意味著要進行全表掃描。
精確匹配某一列,範圍批量另外一列
    精確匹配的列必須是所以中的第一列,範圍匹配的列是第二列,這樣才能使用到上面的索引。

 

B樹索引的使用限制:
1、不是按照最左列開始查詢的,無法使用索引。
2、不能跳過索引的列進行查詢。
3、如果使用到了範圍匹配,那麼範圍匹配右邊的列都無法使用索引查詢。

哈希索引

    哈希索引使用哈希表來實現,只有是精確匹配的時候才會生效。存儲引擎會對索引列計算出一個哈希值,然後保存一個哈希值到行數據的指針。哈希索引由於其特殊的組織方式,限制了其使用場景。哈希索引只適合值比較少的情況,例如枚舉類型。在以下幾種方式中是不適合使用哈希索引的:
1、哈希索引只包含哈希值和指針,不存儲欄位值,因此使用哈希索引避免不了要進行回表查詢。
2、哈希索引數據並不是按照值的順序進行排序的,因此哈希索引無法用來排序
3、哈希索引不支持部分索引列匹配。比如說在(A,B)兩列上簡歷哈希索引,那麼只有在同時使用A、B兩列查詢的時候才會使用哈希索引,只使用A列查詢無法使用哈希索引。
4、哈希索引只支持等值比較,不支持像between and這種範圍查詢。
5、使用哈希索引的時候應該儘量避免哈希衝突。

後記

    資料庫的索引機制解決的問題是在訪問記憶體數據與磁碟數據的速度差別很大的情況下,如何快速訪問數據的問題。只有瞭解了索引的原理才可以更好的設計表的索引欄位以及寫出性能更優的查詢語句。在我們寫SQL語句的時候頭腦中應該大體上能規划出查詢數據以及如何使用索引的過程。下一篇會介紹一下高性能索引的策略,帶你設計出更優的索引。

----------------------------------------------------------------

歡迎關註我的微信公眾號:yunxi-talk,分享Java乾貨,進階Java程式員必備。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [root@lamp02 yum.repos.d]# yum install nfs-utils rpcbind -y Loaded plugins: fastestmirror, securityExisting lock /var/run/yum.pid: another copy is run ...
  • 一、 alias 命令:系統設置命令別名 用法:alias [-p] [name[=value] ... ] 註意‘=’和字元串之間不能包含空格 顯示當前設置的別名:alias 或 alias –p 1 [root@localhost ~]# alias 2 3 alias cp='cp -i' 4 ...
  • 輸入 yum install mysql-server 按Y繼續 安裝完成,設置開機啟動Mysql,輸入 chkconfig --levels 235 mysqld on 然後啟動tomcat,輸入service mysqld start 啟動完畢,然後登錄MYsql設置密碼 輸入set passw ...
  • 開發板 : JZ2440 Linux內核 : Linux-2.6.22.6 Busybox1.29.3 最小根文件系統所需的部分: 1./dev/console /dev/null :創建根文件系統所必備的,指出了所需要的標準輸入,標準輸出,標準錯誤設備終端。 2.init 程式: 當busybox ...
  • 一. 聚合框架 聚合框架是MongoDB的高級查詢語言,它允許我們通過轉換和合併多個文檔中的數據來生成新的單個文檔中不存在的信息。 聚合管道操作主要包含下麵幾個部分: $lookup 在本篇幅中,我們聚焦$lookup的使用。 二. $lookup的功能及語法 1. 主要功能 是將每個輸入待處理的文 ...
  • 1. 說明 本文基於:spark-2.4.0-hadoop2.7-高可用(HA)安裝部署 2. 啟動Spark Shell 在任意一臺有spark的機器上執行 註意: 如果啟動spark shell時沒有指定master地址,但是也可以正常啟動spark shell和執行spark shell中的程 ...
  • 1. 主機規劃 主機名稱 IP地址 操作系統 部署軟體 運行進程 備註 mini01 172.16.1.11【內網】 10.0.0.11 【外網】 CentOS 7.5 Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、sp ...
  • 準備工作 150G及以上的硬碟空間(因為要搭建3個系統組成的集群),cpu儘量i7-7xxx標壓以上,記憶體16G及以上 自行搜索,下載,安裝VMWare 準備CentOS6.8的鏡像文件 註意:安裝虛擬機前必須開啟BIOS虛擬化支持 安裝CentOS 右鍵剛剛創建好虛擬機,在菜單中選擇"設置"選項 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...