MySQL索引的數據結構-B+樹介紹

-Advertisement-

1.聚集索引和輔助索引在資料庫中，B+樹的高度一般都在24層，這也就是說查找某一個鍵值的行記錄時最多只需要2到4次IO，這倒不錯。因為當前一般的機械硬碟每秒至少可以做100次IO，24次的IO意味著查詢時間只需要0.02~0.04秒。資料庫中的B+樹索引可以分為聚集索引（clustered in ...

1.聚集索引和輔助索引

在資料庫中，B+樹的高度一般都在24層，這也就是說查找某一個鍵值的行記錄時最多只需要2到4次IO，這倒不錯。因為當前一般的機械硬碟每秒至少可以做100次IO，24次的IO意味著查詢時間只需要0.02~0.04秒。

資料庫中的B+樹索引可以分為聚集索引（clustered index）和輔助索引（secondary index），

聚集索引與輔助索引相同的是：不管是聚集索引還是輔助索引，其內部都是B+樹的形式，即高度是平衡的，葉子結點存放著所有的數據。

聚集索引與輔助索引不同的是：葉子結點存放的是否是一整行的信息

2.聚集索引
InnoDB存儲引擎表是索引組織表，即表中數據按照主鍵順序存放。而聚集索引（clustered index）就是按照每張表的主鍵構造一棵B+樹，同時葉子結點存放的即為整張表的行記錄數據，也將聚集索引的葉子結點稱為數據頁。聚集索引的這個特性決定了索引組織表中數據也是索引的一部分。同B+樹數據結構一樣，每個數據頁都通過一個雙向鏈表來進行鏈接。

如果未定義主鍵，MySQL取第一個唯一索引（unique）而且只含非空列（NOT NULL）作為主鍵，InnoDB使用它作為聚簇索引。

如果沒有這樣的列，InnoDB就自己產生一個這樣的ID值，它有六個位元組，而且是隱藏的，使其作為聚簇索引。

由於實際的數據頁只能按照一棵B+樹進行排序，因此每張表只能擁有一個聚集索引。在多數情況下，查詢優化器傾向於採用聚集索引。因為聚集索引能夠在B+樹索引的葉子節點上直接找到數據。此外由於定義了數據的邏輯順序，聚集索引能夠特別快地訪問針對範圍值得查詢。

聚集索引的好處之一：它對主鍵的排序查找和範圍查找速度非常快，葉子節點的數據就是用戶所要查詢的數據。如用戶需要查找一張表，查詢最後的10位用戶信息，由於B+樹索引是雙向鏈表，所以用戶可以快速找到最後一個數據頁，並取出10條記錄

聚集索引的好處之二：範圍查詢（range query），即如果要查找主鍵某一範圍內的數據，通過葉子節點的上層中間節點就可以得到頁的範圍，之後直接讀取數據頁即可。

3.輔助索引
表中除了聚集索引外其他索引都是輔助索引（Secondary Index，也稱為非聚集索引），與聚集索引的區別是：輔助索引的葉子節點不包含行記錄的全部數據。

葉子節點除了包含鍵值以外，每個葉子節點中的索引行中還包含一個書簽（bookmark）。該書簽用來告訴InnoDB存儲引擎去哪裡可以找到與索引相對應的行數據。

由於InnoDB存儲引擎是索引組織表，因此InnoDB存儲引擎的輔助索引的書簽就是相應行數據的聚集索引鍵。

輔助索引的存在並不影響數據在聚集索引中的組織，因此每張表上可以有多個輔助索引，但只能有一個聚集索引。

當通過輔助索引來尋找數據時，InnoDB存儲引擎會遍歷輔助索引並通過葉子級別的指針獲得指向主鍵索引的主鍵，然後再通過主鍵索引來找到一個完整的行記錄。

舉例來說，如果在一棵高度為3的輔助索引樹種查找數據，那需要對這個輔助索引樹遍歷3次找到指定主鍵，如果聚集索引樹的高度同樣為3，那麼還需要對聚集索引樹進行3次查找，最終找到一個完整的行數據所在的頁，因此一共需要6次邏輯IO訪問才能得到最終的一個數據頁。

4.聚集索引和非聚集索引的區別
4.1聚集索引
a)紀錄的索引順序與無力順序相同因此更適合between and和order by操作
b)葉子結點直接對應數據從中間級的索引頁的索引行直接對應數據頁
c)每張表只能創建一個聚集索引

4.2非聚集索引
a)索引順序和物理順序無關
b)葉子結點不直接指向數據頁
c)每張表可以有多個非聚集索引，需要更多磁碟和內容
d)多個索引會影響insert和update的速度

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

左匹配原則，聚集索引，回表查詢，索引覆蓋你真的懂了嗎

一個問題有一張表test，這張表除了主鍵id外，還有a，b, c 三列假設給這三個欄位建一個複合索引 index_abc (a, b, c)，問，下麵幾種查詢中，哪種查詢會用到索引 index_abc ？ 1. 查詢一 select * from test where a > 1000 and ...
SqlServer2008R2自動刪除備份

前言：當項目上線並穩定運行後，我們就需要考慮自動備份功能了，自動備份固然簡單，但是需要相應的自動刪除來配合使用。首先我們打開SqlServer管理工具(SSMS)，在左側目錄中找到管理-->右鍵維護計劃-->新建維護計劃雙擊左側下方目錄：創建 ”清除維護“ 任務雙擊後打開提示視窗，我們設置 ...
實時OLAP分析利器Druid介紹

文章目錄前言 Druid介紹主要特性基礎概念數據格式數據攝入數據存儲數據查詢查詢類型架構運維 OLAP方案對比使用場景使用建議參考近期主題前言項目早期、數據（報表分析）的生產、存儲和獲取業務，MySQL基本上可以滿足需要，但是隨著業務的快速增長，數據量翻至億為單位時， ...
HBase Shell 十大花式玩兒法

前言：工欲善其事必先利其器，今天給大家介紹一下HBase Shell十大花式利器，在日常運維工作中，可以試著用起來。 1. 交互模式也就是我們最常用到的Shell命令行的方式。 2. 非交互模式與交互模式比較如果我們想要知道HBase Shell命令執行之後是否成功，那一定要使用非交互模式。 ...
Redis 基本認識（筆試、面試題）

一、Redis 1、簡介【官方簡介地址：】 https://redis.io/topics/introduction 看不懂不要緊，先混個眼熟，慢慢來...。【初步認識 Redis：】 Redis is an open source (BSD licensed), in-memory data ...
CDH6.0.1 搭建過程及所遇到的錯誤處理

一、集群伺服器配置說明（整個過程中我會提前把一些小坑填上，有的坑後面沒有提到） IP 節點名 OS Cores Memory Disk Remark 172.25.16.1 cdh1 CentOS7.5 40 128 4T cloudera Server、cloudera agent 172.25. ...
大數據預處理綜述

數據預處理背景大數據項目開發流程數據質量準確性：數據是正確的，數據存儲在資料庫中的值對應於真實世界的值。數據不准確的原因 1. 數據收集設備故障。 2. 數據輸入錯誤。 3. 數據傳輸過程出錯。 4. 命名約定、數據輸入、輸入欄位格式不一致。相關性：指數據與特定的應用和領域有關。相關性應 ...
帶上數據表，分析一下拼團活動該如何設計

拼團活動該如何設計後臺創建拼團活動一個成熟的拼團活動包含的四個要素： 1 拼團成團商品必須要帶上或者關聯商品，設置拼團時商品的價格，與原價格肯定要低，這樣才能吸引更多的人拼團。 2 拼團人數既然是拼著購買，這裡設置的人數肯定是不能低於2人的。要不然就不成團了。 3 拼團活動有效時間一個拼團 ...