Mysql存儲結構

来源:https://www.cnblogs.com/wolf-bin/archive/2020/03/31/12605475.html
-Advertisement-
Play Games

索引是一種加快查詢速度的數據結構,常用索引結構有hash、B Tree和B+Tree。本節通過分析三者的數據結構來說明為啥Mysql選擇用B+Tree數據結構。 數據結構 Hash hash是基於哈希表完成索引存儲,哈希表特性是數據存放是散列的。 優點: 等值查詢快,通過hash值直接定位到具體的數 ...


索引是一種加快查詢速度的數據結構,常用索引結構有hash、B-Tree和B+Tree。本節通過分析三者的數據結構來說明為啥Mysql選擇用B+Tree數據結構。

數據結構

Hash

hash是基於哈希表完成索引存儲,哈希表特性是數據存放是散列的。

優點:

等值查詢快,通過hash值直接定位到具體的數據。

缺點:

  1. 範圍查詢效率低(表中的數據是無序數據,在日常開發中通常需要範圍查詢,該情況下hash需要一個一個查找後合併返回)
  2. hash表在使用的時會將所有數據載入到記憶體,比較消耗記憶體
  3. hash演算法不好會出現hash碰撞的情況
  4. 哈希索引只包含哈希值和行指針,而不存儲欄位值,索引不能使用索引中的值來避免讀取行
  5. 哈希索引不支持部分列匹配查找,哈希索引是使用索引列的全部內容來計算哈希值

B-Tree

B-Tree特點:

  1. 所有鍵值數據分佈在整棵樹各個節點中
  2. 搜索有可能在非節點結束,在關鍵字全集內查找,類似二分查找
  3. 所有葉子節點都在同一層,並且以升序排列

B+Tree

B+Tree 是在B-Tree的基礎之上做的一種優化,變化如下:

  1. B+Tree 非葉子節點不存放數據
  2. 葉子節點存儲關鍵字和數據,非葉子節點的關鍵字也會沉到葉子節點,並且排序
  3. 葉子節點兩兩指針相互連接,形成一個雙向環形鏈表(符合磁碟的預讀特性),順序查詢性能更高

Mysql為什麼選擇B+Tree

Mysql官網文檔中寫到InnoDB索引用的是 B-tree,但是底層用的是B+Tree。Mysql存儲數據是以頁為單位,預設一個頁可以存放16K數據。假設B-Tree和B+Tree都是3層深度,表中每個記錄為1K(假設的,一般不會這麼大,別較真),那麼三層深度的B-Tree存儲 16 x 16 x 16 = 4096(比這個數還要少,因為每個頁中還要存放指針和其它的數據)。B+Tree第一、二層存放的是key,假設是Long類型的主鍵,那麼第一、二層每頁存放數據約為 16 x 1024 / 8 = 2048,三層深度可以存放 2048 x 2048 x 16 = 6700W。MySQL查詢過程是按頁載入數據的,每載入一頁就是一次IO操作,B+Tree進行三次IO可以查詢6700W數據量。從這裡也可以知道Mysql一般設置三層深度就足夠了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 痞子衡前段時間在支持一個i.MXRT1060客戶項目時遇到了LCD顯示有異常亮點的問題,這個問題的定位和排查花了一點時間,整個過程現在回想起來仍覺得有意思。做嵌入式(尤其是軟體)這行主要工作除了寫代碼就是解Bug了,而且很多時候往往是寫代碼容易,解Bug難,所以解Bug能力是衡量一個工程師是否資深的... ...
  • 嵌入式實時操作系統RTOS里實時的衡量指標到底是什麼呢?1s肯定達不到實時,那需要多快呢?100ms,10ms,1ms,還是100us,10us? 還有這些指標是如何測量的呢? 一個關於1553B匯流排消息周期實時性指標的例子 一篇論文中關於1553B匯流排消息周期實時性的指標,從這個例子中可以看出,對 ...
  • 本文(面對的是程式員而非專業資料庫管理員DBA)以MySQL資料庫為研究對象,討論與資料庫索引相關的一些話題。特別需要說明的是,MySQL支持諸多存儲引擎,而各種存儲引擎對索引的支持也各不相同,因此MySQL資料庫支持多種索引類型,如BTree索引,哈希索引,全文索引等等。為了避免混亂,本文將只關註 ...
  • 今天技術討論群里 “一切隨遇而安”同學看書時出現一個疑問,一個MySQL的表中到底可以有多少個欄位?帶著這個疑問,我們展開了探討,也接著討論了一個單欄位長度的問題。 1. 官方文檔說明 官方文檔的內容如下,主要意思是欄位個數限制達不到理想的4096個,且和欄位類型有關,innodb引擎的欄位上限是1 ...
  • [toc] 背景 應用端需要生成依次遞增的序列來做流水序號等,方案有1、redis /MySQL SEQUENCE引擎生成序列;2、MySQL中myisam表 replace into方式;3、MySQL中innodb表INSERT ... ON DUPLICATE KEY方式 分析 redis / ...
  • 慢查詢日誌概述 所謂慢查詢日誌,就是用於記錄MySQL中響應時間超過設定閾值的SQL語句,通過打開慢查詢開關,MySQL會將大於閾值的SQL記錄在日誌中,以便於分析性能。 慢查詢日誌選項預設是關閉的,如果要開啟,則需要手動設置。 慢查詢日誌選項不建議一直開啟,因為記錄日誌意味著IO操作,本身對性能有 ...
  • 前言 為了避免單點故障,我們需要將數據複製多份部署在多台不同的伺服器上,即使有一臺伺服器出現故障其他伺服器依然可以繼續提供服務 作用: 數據備份 擴展讀性能(讀寫分離) 複製方式: 全量複製 部分複製 實現方式 1、一主二撲 A(B、C) 一個Master兩個Slave 2、薪火相傳(去中心化) A ...
  • 解決方法可用以下命令: 命令行登錄mysql; mysql>use mysql; mysql>ALTER USER root IDENTIFIED WITH mysql_native_password BY '你的密碼'; mysql>FLUSH PRIVILEGES; 網上說用: MySql 8. ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...