Mysql 數據恢復邏輯 基於binlog redolog undolog

来源:https://www.cnblogs.com/soker/archive/2022/07/27/16525546.html
-Advertisement-
Play Games

註:文中有個易混淆的地方"事務" sql事務,即每次資料庫操作生成的事務,這個事務trx_id只在undolog里存儲,同時undolog維護了此事務是否完成的狀態。 日誌持久化事務,為了保證redolog和binlog的一致性而用的Mysql內部獨立維護的2PC提交事務。這個xid只有在redol ...


註:文中有個易混淆的地方"事務"

  1. sql事務,即每次資料庫操作生成的事務,這個事務trx_id只在undolog里存儲,同時undolog維護了此事務是否完成的狀態。
  2. 日誌持久化事務,為了保證redolog和binlog的一致性而用的Mysql內部獨立維護的2PC提交事務。這個xid只有在redolog和binlog持久化文件中存儲。

各日誌的存儲內容

閱讀前提:需要對mysql的數據存儲結構有一定瞭解,即數據頁的持久化和記憶體讀取邏輯。

binlog日誌

binlog日誌存儲的是對資料庫實際的數據操作,可以理解為存儲的所有的資料庫更新sql。
mysql預設不開啟binlog,binlog主要用於主從同步和與其他資料庫的數據共用(通過中間件監聽binlog)。

undolog日誌

undolog存儲的是事務的回滾數據,存儲的數據回滾的關鍵信息。undolog數據存儲在undolog表空間中,也是通過數據頁的形式存儲,和普通的數據頁一樣,也會不定期的進行持久化。
undolog也通過頁存儲,有自己獨立的表空間,所以undolog記錄的時候,舊的undolog可能會被覆蓋(當然mysql會保證未提交事務的undolog和用於mvvc的undolog是不會被覆蓋的),同時也會生成相應的redolog。有的人理解為redolog里也存儲了undolog的日誌,其實是不對的,這個日誌只是用來恢復undolog表空間的,並不是undolog實際的日誌。

redolog日誌

redolog存儲的是對頁結構的更新日誌,可以理解為記錄了數據頁里修改了哪幾個位元組。用於mysql崩潰後的數據恢復,數據存儲在ib_logfile中。
redolog中有一個重要參數即checkpoint_lsn記錄了哪些redolog對應的數據頁已經持久化了,是數據恢復的一個非常重要的參數。
同時為了保證數據持久化,事務提交時所有的redolog必須持久化,由於多個事務的redolog是可以穿插寫入的,這就導致有部分未提交的事務被刷盤了。

redolog和binlog的二階段提交

redolog和binlog的二階段提交主要是為了防止系統崩潰時,redolog寫完,binlog沒有寫,導致主從不一致的問題。
innodb維護了一套事務表(註意這裡的事務不是mysql的事務,是redolog持久化的事務),redolog和binlog持久化時會生成一個新的事務,並分配一個xid即2PC事務id給這次持久化操作。

持久化流程

  1. redolog寫盤並存儲xid
  2. binlog寫盤並存儲xid,2PC事務標記已提交,redolog事務提交。

崩潰恢復

  1. 掃描最後一個binlog文件,提取其中的xid;
  2. InnoDB 維持了狀態為Prepare的事務鏈表,將這些事務的xid和binlog中記錄的xid做比較,如果在binlog中存在則提交,不存在則回滾事務。

數據恢復流程 基於binlog redolog undolog

image

  1. 通過binlog的xid和事務鏈表中的事務xid比較,找到不存在的事務的xid,去redolog中把這些事務回滾(刪除)。
  2. 以checkpoint點的redolog為起點開始恢複數據,即恢覆上圖checkpoint到binlog之間的redolog數據。
  3. 由於undolog數據頁的修改也記錄在redolog中,未寫盤的undolog數據頁也被恢復。
  4. 在undolog表空間中查詢未提交的事務(Sql事務)執行undolog日誌進行回滾
  5. 數據恢復完成

參考資料:《MySQL是怎樣運行的》及其他網路資料


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 寫在前面 本系列的文章是博主邊學邊記錄的,可能不是特別的正確,因為會加上博主自己的理解,僅供參考。 正文 一、文件的物理組織方式 目前常用的外存組織方式有: 1.連續組織方式 為每個文件分配一篇連續的磁碟空間,稱為連續組織方式。 2.鏈接組織方式 在對文件採取鏈式組織方式時,可以為每個文件分配不連續 ...
  • 1. CentOS 7系統開機時選擇預設第一啟動項,按字母"e"鍵編輯啟動項;如圖1所示 圖1 2. 使用鍵盤上下左右方向鍵,往下找到 linux16 開頭的一行,定位到 ro (read only);如圖2所示 圖2 3. 編輯 ro 為 rw (read write),併在其後寫入 init=/ ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 前言 本環境通過使用VMware在Ubuntu20.04下通過VScode搭建docker環境,可通過遠程連接容器進行開發。(僅作參考) 一、環境準備 VMware 15 pro,Ubuntu20.04,VScode(Linux版本) 虛擬機搭建 ...
  • 寫在前面 本系列的文章是博主邊學邊記錄的,可能不是特別的正確,因為會加上博主自己的理解,僅供參考。 正文: 1.文件目錄 文件目錄是一種數據結構,用於標識系統中文件及其物理地址,供檢索的時候使用。對於目錄的管理有如下要求: 1.實現按名存取 2.提高對目錄的檢索速度 3.文件共用 在多用戶系統中,應 ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 項目部署 之前我們講解Linux操作系統時,就提到,我們服務端開發工程師學習Linux系統的目的就是將來我們開發的項目絕大部分情況下都需要部署在Linux系統中。那麼在本章節,我們將通過兩種方式,來演示項目部署,分別是:手動部署項目 和 基於sh ...
  • STM32測量外部電源的電壓 本人在項目中遇到一個需求:使用電池給STM32開發板供電,並需要實時顯示當前電源的電量情況。這個需求可以說是很常見了,但是卻困擾了我整整一個多月。 在收到這個需求的時候我首先想到的就是上網查找相關的技術貼,其中一條名為《基於STM32F103內部AD測量電池電壓》的帖子 ...
  • 電腦的演進就是一部在挖坑和填坑之間反覆橫跳的發展史。對這一點的理解會隨著本文的後續講述逐漸加深。比如高速緩存Cache很好地解決了CPU與記憶體的速度矛盾,但是也為電腦系統帶來了更高的複雜度 ...
  • 1. Redis 底層數據結構 Redis資料庫就像是一個哈希表,首先對key進行哈希運算得到哈希值再取模得到一個下標,每個元素是一個節點,節點之間形成鏈表。這感覺有點像Java中的HashMap。 不同的數據類型的實現方式是不一樣的,可以通過object encoding命令查看底層真正的數據存儲 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...