MySQL之 InnoDB 記憶體結構

来源:https://www.cnblogs.com/zwhdd/archive/2023/03/29/17268132.html
-Advertisement-
Play Games

從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛 下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構和磁碟結構兩大部分。 InnoDB 記憶體結構 1. Buffer Pool Buffer Pool:緩衝池,簡稱BP。其作 ...


從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛
下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構磁碟結構兩大部分。
01.jpg

InnoDB 記憶體結構

1. Buffer Pool

Buffer Pool:緩衝池,簡稱BP。其作用是用來緩存表數據與索引數據,減少磁碟IO操作,提升效率。
Buffer Pool由 緩存數據頁(Page) 和 對緩存數據頁進行描述的控制塊 組成, 控制塊中存儲著對應緩存頁的所屬的 表空間、數據頁的編號、以及對應緩存頁在Buffer Pool中的地址等信息.
Buffer Pool預設大小是128M, 以Page頁為單位,Page頁預設大小16K,而控制塊的大小約為數據頁的5%,大概是800位元組。
03.jpg

註:Buffer Pool大小為128M指的就是緩存頁的大小,控制塊則一般占5%,所以每次會多申請6M的記憶體空間用於存放控制塊
如何判斷一個頁是否在BufferPool中緩存 ?
MySQl中有一個哈希表數據結構,它使用表空間號+數據頁號,作為一個key,然後緩衝頁對應的控制塊作為value。
10.jpg

  • 當需要訪問某個頁的數據時,先從哈希表中根據表空間號+頁號看看是否存在對應的緩衝頁。
  • 如果有,則直接使用;如果沒有,就從free鏈表中選出一個空閑的緩衝頁,然後把磁碟中對應的頁載入到該緩衝頁的位置

2.Page管理機制

Page頁分類

BufferPool的底層採用鏈表數據結構管理Page。在InnoDB訪問表記錄和索引時會在Page頁中緩存,以後使用可以減少磁碟IO操作,提升效率。
Page根據狀態可以分為三種類型:
05.jpg

  • ree page : 空閑page,未被使用
  • clean page:被使用page,數據沒有被修改過
  • dirty page:臟頁,被使用page,數據被修改過,頁中數據和磁碟的數據產生了不一致

Page頁如何管理

針對上面所說的三種page類型,InnoDB通過三種鏈表結構來維護和管理

1. free list 表示空閑緩衝區,管理free page
  • Buffer Pool的初始化過程中,是先向操作系統申請連續的記憶體空間,然後把它劃分成若幹個【控制塊&緩衝頁】的鍵值對。
  • free鏈表是把所有空閑的緩衝頁對應的控制塊作為一個個的節點放到一個鏈表中,這個鏈表便稱之為free鏈表
  • 基節點: free鏈表中只有一個基節點是不記錄緩存頁信息(單獨申請空間),它裡面就存放了free鏈表的頭節點的地址,尾節點的地址,還有free鏈表裡當前有多少個節點。

07.jpg
*磁碟載入頁的流程: *

  1. 從free鏈表中取出一個空閑的控制塊(對應緩衝頁)。
  2. 把該緩衝頁對應的控制塊的信息填上(例如:頁所在的表空間、頁號之類的信息)。
  3. 把該緩衝頁對應的free鏈表節點(即:控制塊)從鏈表中移除。表示該緩衝頁已經被使用了。
2.flush list:表示需要刷新到磁碟的緩衝區,管理dirty page,內部page按修改時間排序。
  • InnoDB引擎為了提高處理效率,在每次修改緩衝頁後,並不是立刻把修改刷新到磁碟上,而是在未來的某個時間點進行刷新操作. 所以需要使用到flush鏈表存儲臟頁,凡是被修改過的緩衝頁對應的控制塊都會作為節點加入到flush鏈表.
  • flush鏈表的結構與free鏈表的結構相似

08.jpg
註: 臟頁即存在於flush鏈表,也在LRU鏈表中,但是兩種互不影響,LRU鏈表負責管理page的可用性和釋放,而flush鏈表負責管理臟頁的刷盤操作。

3.lru list:表示正在使用的緩衝區,管理clean page和dirty page。

緩衝區以midpoint為基點,前面鏈表稱為new列表區,存放經常訪問的數據,占63%;後面的鏈表稱為old列表區,存放使用較少數據,占37%

普通LRU演算法

LRU = Least Recently Used(最近最少使用): 就是末尾淘汰法,新數據從鏈表頭部加入,釋放空間時從末尾淘汰.
06.jpg

  1. 當要訪問某個頁時,如果不在Buffer Pool,需要把該頁載入到緩衝池,並且把該緩衝頁對應的控制塊作為節點添加到LRU鏈表的頭部。
  2. 當要訪問某個頁時,如果在Buffer Pool中,則直接把該頁對應的控制塊移動到LRU鏈表的頭部
  3. 當需要釋放空間時,從最末尾淘汰

普通LRU鏈表的優缺點
優點: 所有最近使用的數據都在鏈表表頭,最近未使用的數據都在鏈表表尾,保證熱數據能最快被獲取到
缺點:

  1. 如果發生全表掃描(比如:沒有建立合適的索引 or 查詢時使用select * 等),則有很大可能將真正的熱數據淘汰掉.
  2. 由於MySQL中存在預讀機制,很多預讀的頁都會被放到LRU鏈表的表頭。如果這些預讀的頁都沒有用到的話,這樣,會導致很多尾部的緩衝頁很快就會被淘汰。

02.jpg

改進型LRU演算法

改性LRU:鏈表分為new和old兩個部分,加入元素時並不是從表頭插入,而是從中間midpoint位置插入(就是說從磁碟中新讀出的數據會放在冷數據區的頭部),如果數據很快被訪問,那麼page就會向new列表頭部移動,如果數據沒有被訪問,會逐步向old尾部移動,等待淘汰。
11.jpg
冷數據區的數據頁什麼時候會被轉到到熱數據區呢 ?

  1. 如果該數據頁在LRU鏈表中存在時間超過1s,就將其移動到鏈表頭部 ( 鏈表指的是整個LRU鏈表)
  2. 如果該數據頁在LRU鏈表中存在的時間短於1s,其位置不變(由於全表掃描有一個特點,就是它對某個頁的頻繁訪問總耗時會很短)
  3. 1s這個時間是由參數 innodb_old_blocks_time 控制的

3. Change Buffer

change Buffer基本概念

Change Buffer:寫緩衝區,是針對二級索引(輔助索引) 頁的更新優化措施
Change Buffer作用: 在進行DML操作時,如果請求的是 輔助索引(非唯一鍵索引)沒有在緩衝池 中時,並不會立刻將磁碟頁載入到緩衝池,而是在CB記錄緩衝變更,等未來數據被 讀取時,再將數據合併恢復到BP中。
ChangeBuffer占用BufferPool空間,預設占25%,最大允許占50%,可以根據讀寫 業務量來進行調整。參數innodb_change_buffer_max_size;
43.jpg

  1. ChangeBuffer用於存儲SQL變更操作,比如Insert/Update/Delete等SQL語句
  2. ChangeBuffer中的每個變更操作都有其對應的數據頁,並且該數據頁未載入到緩存中;
  3. 當ChangeBuffer中變更操作對應的數據頁載入到緩存中後,InnoDB會把變更操作Merge到數據頁上;
  4. InnoDB會定期載入ChangeBuffer中操作對應的數據頁到緩存中,並Merge變更操作

change buffer更新流程

情況1: 對於唯一索引來說,需要將數據頁讀入記憶體,判斷到沒有衝突,插入這個值,語句執行結束;
情況2: 對於普通索引來說,則是將更新記錄在 change buffer,流程如下:

  1. 更新一條記錄時,該記錄在BufferPool存在,直接在BufferPool修改,一次記憶體操作。

  2. 如果該記錄在BufferPool不存在(沒有命中),在不影響數據一致性的前提下,InnoDB 會將這些更新操作緩存在 change buffer 中不用再去磁碟查詢數據,避免一次磁碟IO。

  3. 當下次查詢記錄時,會將數據頁讀入記憶體,然後執行change buffer中與這個頁有關的操作.通過這種方式就能保證這個數據邏輯的正確性。

    12.jpg

寫緩衝區,僅適用於非唯一普通索引頁,為什麼?

如果在索引設置唯一性,在進行修改時,InnoDB必須要做唯一性校驗,因此必須查詢磁碟,做一次IO操作。會直接將記錄查詢到BufferPool中,然後在緩衝池修改,不會在ChangeBuffer操作。

什麼情況下進行 merge ?

將 change buffer 中的操作應用到原數據頁,得到最新結果的過程稱為merge .
change buffer,實際上它是可以持久化的數據。也就是說,change buffer 在記憶體中有拷貝,也會被寫入到磁碟上,以下情況會進行持久化:

  1. 訪問這個數據頁會觸發 merge
  2. 系統有後臺線程會定期 merge。
  3. 在資料庫正常關閉(shutdown)的過程中,也會執行 merge 操作。

Change Buffer 的使用場景

  • change buffer 的主要目的就是將記錄的變更動作緩存下來,所以在merge發生之前應 當儘可能多的緩存變更信 息,這樣 change buffer的優勢發揮的就越明顯.
  • 應用場景: 對於寫多讀少的業務來說,頁面在寫完以後馬上被訪問到的概率比較小,此時 change buffer 的使用 效果最好。這種業務模型常見的就是賬單類、日誌類的系統。

4. Log Buffer

Log Buffer:日誌緩衝區,用來保存要寫入磁碟上log文件(Redo/Undo)的數據,日誌緩衝區的內容定期刷新到磁碟log文件中。日誌緩衝區滿時會自動將其刷新到磁碟,當遇到BLOB或多行更新的大事務操作時,增加日誌緩衝區可以節省磁碟I/O。
LogBuffer主要作用是: 用來優化每次更新操作之後都要寫入redo log 而產生的磁碟IO問題.
14.jpg
LogBuffer空間滿了,會自動寫入磁碟。可以通過將innodb_log_buffer_size參數調大,減少磁碟IO頻率

本文來自博客園,作者:笨笨的二黃子,轉載請註明原文鏈接:https://www.cnblogs.com/zwhdd/p/17268132.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 參考:(25條消息) 虛擬機安裝Arch Linux_虛擬機安裝archlinux_追光少年羽的博客-CSDN博客 準備工作 在開始安裝 Arch Linux 之前,需要先下載安裝映像文件並創建好虛擬機環境。 下載安裝鏡像 下麵是 Arch Linux 官方的安裝文件下載地址: Arch Linux ...
  • 解決辦法 如果最近升級到了 openssh 8.8 版,你會發現連接某些之前連接得好好的伺服器突然無法連接: Unable to negotiate with x.x.x.x port 2222: no matching host key type found. Their offer: ssh-r ...
  • 1. 三值邏輯 1.1. 真 1.1.1. true 1.2. 假 1.2.1. false 1.3. 不確定 1.3.1. unknown 2. 兩種NULL 2.1. 未知”(unknown) 2.1.1. 不知道戴墨鏡的人眼睛是什麼顏色 2.1.2. 雖然現在不知道,但加上某些條件後就可以知道 ...
  • 通過Hbase與Cassandra對比,層次展開瞭解Apache Cassandra特性和使用場景,通過部署但實力和多實例集群進一步理解其運作,最後通過CQL及其客戶端命令工具理解其數據模型和數據類型,通過對鍵空間、表、索引、數據操作熟悉常見CQL語法和使用。 ...
  • 所需準備 1.安裝資料庫實例,如SQLEXPRADV_x64_CHS 2.安裝資料庫管理軟體,如SQL Server Management Studio 操作步驟 1.打開SQL Server Management Studio,使用Windows身份驗證登入。 2.點擊伺服器實例,右鍵屬性->安全 ...
  • Redis資料庫 Redis(Remote Dictionary Server)是一個使用 C 語言編寫的,高性能非關係型的鍵值對資料庫。與傳統資料庫不同的是,Redis 的數據是存在記憶體中的,所以讀寫速度非常快,被廣泛應用於緩存方向。Redis可以將數據寫入磁碟中,保證了數據的安全不丟失,而且Re ...
  • RMAN備份時會記錄每一次備份的狀態信息,例如COMPLETED,FAILED等,但是使用下麵腳本查詢資料庫時,偶爾你會看到有些備份的狀態為COMPLETED WITH WARNINGS SET LINESIZE 1080;COL STATUS FORMAT A9;COL START_TIME FO ...
  • 摘要:智能把控大數據量查詢,防患系統奔潰於未然。 本文分享自華為雲社區《拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能》,作者:GaussDB 資料庫。 什麼是最大讀取行 一直以來,大數據量查詢是資料庫DBA們調優的重點,DBA們通常十八般武藝輪番上陣以期提升大數據查詢的性能:例 ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...