MySQL之 InnoDB 記憶體結構

来源:https://www.cnblogs.com/zwhdd/archive/2023/03/29/17268132.html
-Advertisement-
Play Games

從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛 下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構和磁碟結構兩大部分。 InnoDB 記憶體結構 1. Buffer Pool Buffer Pool:緩衝池,簡稱BP。其作 ...


從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛
下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構磁碟結構兩大部分。
01.jpg

InnoDB 記憶體結構

1. Buffer Pool

Buffer Pool:緩衝池,簡稱BP。其作用是用來緩存表數據與索引數據,減少磁碟IO操作,提升效率。
Buffer Pool由 緩存數據頁(Page) 和 對緩存數據頁進行描述的控制塊 組成, 控制塊中存儲著對應緩存頁的所屬的 表空間、數據頁的編號、以及對應緩存頁在Buffer Pool中的地址等信息.
Buffer Pool預設大小是128M, 以Page頁為單位,Page頁預設大小16K,而控制塊的大小約為數據頁的5%,大概是800位元組。
03.jpg

註:Buffer Pool大小為128M指的就是緩存頁的大小,控制塊則一般占5%,所以每次會多申請6M的記憶體空間用於存放控制塊
如何判斷一個頁是否在BufferPool中緩存 ?
MySQl中有一個哈希表數據結構,它使用表空間號+數據頁號,作為一個key,然後緩衝頁對應的控制塊作為value。
10.jpg

  • 當需要訪問某個頁的數據時,先從哈希表中根據表空間號+頁號看看是否存在對應的緩衝頁。
  • 如果有,則直接使用;如果沒有,就從free鏈表中選出一個空閑的緩衝頁,然後把磁碟中對應的頁載入到該緩衝頁的位置

2.Page管理機制

Page頁分類

BufferPool的底層採用鏈表數據結構管理Page。在InnoDB訪問表記錄和索引時會在Page頁中緩存,以後使用可以減少磁碟IO操作,提升效率。
Page根據狀態可以分為三種類型:
05.jpg

  • ree page : 空閑page,未被使用
  • clean page:被使用page,數據沒有被修改過
  • dirty page:臟頁,被使用page,數據被修改過,頁中數據和磁碟的數據產生了不一致

Page頁如何管理

針對上面所說的三種page類型,InnoDB通過三種鏈表結構來維護和管理

1. free list 表示空閑緩衝區,管理free page
  • Buffer Pool的初始化過程中,是先向操作系統申請連續的記憶體空間,然後把它劃分成若幹個【控制塊&緩衝頁】的鍵值對。
  • free鏈表是把所有空閑的緩衝頁對應的控制塊作為一個個的節點放到一個鏈表中,這個鏈表便稱之為free鏈表
  • 基節點: free鏈表中只有一個基節點是不記錄緩存頁信息(單獨申請空間),它裡面就存放了free鏈表的頭節點的地址,尾節點的地址,還有free鏈表裡當前有多少個節點。

07.jpg
*磁碟載入頁的流程: *

  1. 從free鏈表中取出一個空閑的控制塊(對應緩衝頁)。
  2. 把該緩衝頁對應的控制塊的信息填上(例如:頁所在的表空間、頁號之類的信息)。
  3. 把該緩衝頁對應的free鏈表節點(即:控制塊)從鏈表中移除。表示該緩衝頁已經被使用了。
2.flush list:表示需要刷新到磁碟的緩衝區,管理dirty page,內部page按修改時間排序。
  • InnoDB引擎為了提高處理效率,在每次修改緩衝頁後,並不是立刻把修改刷新到磁碟上,而是在未來的某個時間點進行刷新操作. 所以需要使用到flush鏈表存儲臟頁,凡是被修改過的緩衝頁對應的控制塊都會作為節點加入到flush鏈表.
  • flush鏈表的結構與free鏈表的結構相似

08.jpg
註: 臟頁即存在於flush鏈表,也在LRU鏈表中,但是兩種互不影響,LRU鏈表負責管理page的可用性和釋放,而flush鏈表負責管理臟頁的刷盤操作。

3.lru list:表示正在使用的緩衝區,管理clean page和dirty page。

緩衝區以midpoint為基點,前面鏈表稱為new列表區,存放經常訪問的數據,占63%;後面的鏈表稱為old列表區,存放使用較少數據,占37%

普通LRU演算法

LRU = Least Recently Used(最近最少使用): 就是末尾淘汰法,新數據從鏈表頭部加入,釋放空間時從末尾淘汰.
06.jpg

  1. 當要訪問某個頁時,如果不在Buffer Pool,需要把該頁載入到緩衝池,並且把該緩衝頁對應的控制塊作為節點添加到LRU鏈表的頭部。
  2. 當要訪問某個頁時,如果在Buffer Pool中,則直接把該頁對應的控制塊移動到LRU鏈表的頭部
  3. 當需要釋放空間時,從最末尾淘汰

普通LRU鏈表的優缺點
優點: 所有最近使用的數據都在鏈表表頭,最近未使用的數據都在鏈表表尾,保證熱數據能最快被獲取到
缺點:

  1. 如果發生全表掃描(比如:沒有建立合適的索引 or 查詢時使用select * 等),則有很大可能將真正的熱數據淘汰掉.
  2. 由於MySQL中存在預讀機制,很多預讀的頁都會被放到LRU鏈表的表頭。如果這些預讀的頁都沒有用到的話,這樣,會導致很多尾部的緩衝頁很快就會被淘汰。

02.jpg

改進型LRU演算法

改性LRU:鏈表分為new和old兩個部分,加入元素時並不是從表頭插入,而是從中間midpoint位置插入(就是說從磁碟中新讀出的數據會放在冷數據區的頭部),如果數據很快被訪問,那麼page就會向new列表頭部移動,如果數據沒有被訪問,會逐步向old尾部移動,等待淘汰。
11.jpg
冷數據區的數據頁什麼時候會被轉到到熱數據區呢 ?

  1. 如果該數據頁在LRU鏈表中存在時間超過1s,就將其移動到鏈表頭部 ( 鏈表指的是整個LRU鏈表)
  2. 如果該數據頁在LRU鏈表中存在的時間短於1s,其位置不變(由於全表掃描有一個特點,就是它對某個頁的頻繁訪問總耗時會很短)
  3. 1s這個時間是由參數 innodb_old_blocks_time 控制的

3. Change Buffer

change Buffer基本概念

Change Buffer:寫緩衝區,是針對二級索引(輔助索引) 頁的更新優化措施
Change Buffer作用: 在進行DML操作時,如果請求的是 輔助索引(非唯一鍵索引)沒有在緩衝池 中時,並不會立刻將磁碟頁載入到緩衝池,而是在CB記錄緩衝變更,等未來數據被 讀取時,再將數據合併恢復到BP中。
ChangeBuffer占用BufferPool空間,預設占25%,最大允許占50%,可以根據讀寫 業務量來進行調整。參數innodb_change_buffer_max_size;
43.jpg

  1. ChangeBuffer用於存儲SQL變更操作,比如Insert/Update/Delete等SQL語句
  2. ChangeBuffer中的每個變更操作都有其對應的數據頁,並且該數據頁未載入到緩存中;
  3. 當ChangeBuffer中變更操作對應的數據頁載入到緩存中後,InnoDB會把變更操作Merge到數據頁上;
  4. InnoDB會定期載入ChangeBuffer中操作對應的數據頁到緩存中,並Merge變更操作

change buffer更新流程

情況1: 對於唯一索引來說,需要將數據頁讀入記憶體,判斷到沒有衝突,插入這個值,語句執行結束;
情況2: 對於普通索引來說,則是將更新記錄在 change buffer,流程如下:

  1. 更新一條記錄時,該記錄在BufferPool存在,直接在BufferPool修改,一次記憶體操作。

  2. 如果該記錄在BufferPool不存在(沒有命中),在不影響數據一致性的前提下,InnoDB 會將這些更新操作緩存在 change buffer 中不用再去磁碟查詢數據,避免一次磁碟IO。

  3. 當下次查詢記錄時,會將數據頁讀入記憶體,然後執行change buffer中與這個頁有關的操作.通過這種方式就能保證這個數據邏輯的正確性。

    12.jpg

寫緩衝區,僅適用於非唯一普通索引頁,為什麼?

如果在索引設置唯一性,在進行修改時,InnoDB必須要做唯一性校驗,因此必須查詢磁碟,做一次IO操作。會直接將記錄查詢到BufferPool中,然後在緩衝池修改,不會在ChangeBuffer操作。

什麼情況下進行 merge ?

將 change buffer 中的操作應用到原數據頁,得到最新結果的過程稱為merge .
change buffer,實際上它是可以持久化的數據。也就是說,change buffer 在記憶體中有拷貝,也會被寫入到磁碟上,以下情況會進行持久化:

  1. 訪問這個數據頁會觸發 merge
  2. 系統有後臺線程會定期 merge。
  3. 在資料庫正常關閉(shutdown)的過程中,也會執行 merge 操作。

Change Buffer 的使用場景

  • change buffer 的主要目的就是將記錄的變更動作緩存下來,所以在merge發生之前應 當儘可能多的緩存變更信 息,這樣 change buffer的優勢發揮的就越明顯.
  • 應用場景: 對於寫多讀少的業務來說,頁面在寫完以後馬上被訪問到的概率比較小,此時 change buffer 的使用 效果最好。這種業務模型常見的就是賬單類、日誌類的系統。

4. Log Buffer

Log Buffer:日誌緩衝區,用來保存要寫入磁碟上log文件(Redo/Undo)的數據,日誌緩衝區的內容定期刷新到磁碟log文件中。日誌緩衝區滿時會自動將其刷新到磁碟,當遇到BLOB或多行更新的大事務操作時,增加日誌緩衝區可以節省磁碟I/O。
LogBuffer主要作用是: 用來優化每次更新操作之後都要寫入redo log 而產生的磁碟IO問題.
14.jpg
LogBuffer空間滿了,會自動寫入磁碟。可以通過將innodb_log_buffer_size參數調大,減少磁碟IO頻率

本文來自博客園,作者:笨笨的二黃子,轉載請註明原文鏈接:https://www.cnblogs.com/zwhdd/p/17268132.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 參考:(25條消息) 虛擬機安裝Arch Linux_虛擬機安裝archlinux_追光少年羽的博客-CSDN博客 準備工作 在開始安裝 Arch Linux 之前,需要先下載安裝映像文件並創建好虛擬機環境。 下載安裝鏡像 下麵是 Arch Linux 官方的安裝文件下載地址: Arch Linux ...
  • 解決辦法 如果最近升級到了 openssh 8.8 版,你會發現連接某些之前連接得好好的伺服器突然無法連接: Unable to negotiate with x.x.x.x port 2222: no matching host key type found. Their offer: ssh-r ...
  • 1. 三值邏輯 1.1. 真 1.1.1. true 1.2. 假 1.2.1. false 1.3. 不確定 1.3.1. unknown 2. 兩種NULL 2.1. 未知”(unknown) 2.1.1. 不知道戴墨鏡的人眼睛是什麼顏色 2.1.2. 雖然現在不知道,但加上某些條件後就可以知道 ...
  • 通過Hbase與Cassandra對比,層次展開瞭解Apache Cassandra特性和使用場景,通過部署但實力和多實例集群進一步理解其運作,最後通過CQL及其客戶端命令工具理解其數據模型和數據類型,通過對鍵空間、表、索引、數據操作熟悉常見CQL語法和使用。 ...
  • 所需準備 1.安裝資料庫實例,如SQLEXPRADV_x64_CHS 2.安裝資料庫管理軟體,如SQL Server Management Studio 操作步驟 1.打開SQL Server Management Studio,使用Windows身份驗證登入。 2.點擊伺服器實例,右鍵屬性->安全 ...
  • Redis資料庫 Redis(Remote Dictionary Server)是一個使用 C 語言編寫的,高性能非關係型的鍵值對資料庫。與傳統資料庫不同的是,Redis 的數據是存在記憶體中的,所以讀寫速度非常快,被廣泛應用於緩存方向。Redis可以將數據寫入磁碟中,保證了數據的安全不丟失,而且Re ...
  • RMAN備份時會記錄每一次備份的狀態信息,例如COMPLETED,FAILED等,但是使用下麵腳本查詢資料庫時,偶爾你會看到有些備份的狀態為COMPLETED WITH WARNINGS SET LINESIZE 1080;COL STATUS FORMAT A9;COL START_TIME FO ...
  • 摘要:智能把控大數據量查詢,防患系統奔潰於未然。 本文分享自華為雲社區《拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能》,作者:GaussDB 資料庫。 什麼是最大讀取行 一直以來,大數據量查詢是資料庫DBA們調優的重點,DBA們通常十八般武藝輪番上陣以期提升大數據查詢的性能:例 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...