Xtrabackup工作原理

来源:https://www.cnblogs.com/yanyanqaq/archive/2020/05/20/12922515.html
-Advertisement-
Play Games

[TOC] 1.Xtrabackup介紹 Xtrabackup是Percona公司專門針對MySQL資料庫開發的一款開源免費的物理備份(熱備)工具,可以對InnoDB和XtraDB等事務引擎的資料庫實現非阻塞(即不鎖表)方式的備份,也可以針對MyISAM等非事務引擎實現鎖表方式備份。 Xtrabac ...


目錄

1.Xtrabackup介紹

Xtrabackup是Percona公司專門針對MySQL資料庫開發的一款開源免費的物理備份(熱備)工具,可以對InnoDB和XtraDB等事務引擎的資料庫實現非阻塞(即不鎖表)方式的備份,也可以針對MyISAM等非事務引擎實現鎖表方式備份。

Xtrabackup的主要特點:

1、直接複製物理文件,備份和恢複數據的速度非常快,安全可靠。
2、在備份期間執行的事務不會間斷,備份InnoDB數據不會影響業務。
3、備份期間不會增加太多資料庫的性能壓力。
4、支持對備份的數據進行自動校驗。
5、支持全量、增量、壓縮備份及流備份。
6、支持線上遷移表以及快速創建新的從庫。
7、支持幾乎所有版本的MySQL和MariaDB。

2.Xtrabackup備份涉及的資料庫名詞

2.1.MySQL數據文件擴展名知識說明

Xtrabackup備份中涉及的一些資料庫專業信息知識:

文件擴展名 文件作用說明
.idb文件 以獨立表空間存儲的InnoDB引擎類型的數據文件擴展名
.ibdata文件 以共用表空間存儲的InnoDB引擎類型的數據文件擴展名
.frm文件 存放與表相關的元數據(meta)信息以及表結構的定義信息
.MYD文件 存放MyISAM引擎表的數據文件擴展名
.MYI文件 存放MyISAM引擎表的索引信息文件擴展名

2.2.事務型引擎的ACID特性

在MySQL中,InnoDB和MariaDB中的XtraDB都是事務型引擎,事務型引擎的共同特征是具備事務的4個特性,這4個特性分別是:原子性(atomicity)、一致性(consistency)、隔離性(isolation)、持久性(durability),又稱為ACID特性。

ACID特性說明:

ACID特性 說明
原子性 事務的所有SQL語句操作,要麼全部成功,要麼全部失敗
一致性 事務開始之前和結束之後,資料庫應保證數據的完整性不被破壞
隔離性 當多個事務併發訪問同一個數據源時,資料庫能夠保持每個訪問的事務之間是隔離的,互不影響的
持久性 事務處理完成之後,事務所做的更改都會是持久化存儲,不會丟失數據

2.3.InnoDB引擎內部知識概念

InnoDB基礎概念知識:

概念名稱 說明
表空間(tablespaces) 表空間是一個邏輯的概念,表空間里存放的是表的數據和索引,這些表的數據和索引又有不同的存儲方式,表空間最終體現的是磁碟上資料庫的各種物理數據文件
獨立表空間(independent tablespaces) 在開啟InnoDB的innodb_file_per_table=On這個參數之後,對於每一個新建的InnoDB表,資料庫目錄下都會多出來一個對應的存放該表數據的.ibd文件
共用表空間(shared tablespaces) 5.6版本以前,MySQL的預設配置就是共用表空間模式,即所有表的數據都會在一個或幾個大數據文件中存放
頁(page) MySQL的每個表空間都是由若幹個頁組成的,且每個實例里的每個表空間內都有相同的頁大小,預設值是16KB,可以通過innodb_page_size調整頁大小,每個頁中都包含了表的數據。組成表空間數據的最小單位是頁
區段(extent) 在表空間中,系統會把每若幹個頁進行分組管理,這個組就叫作區段,預設一個區段的大小是64頁
段(segments) 段是由多個不同的區段組成的更大的分組。當一個段增加的時候,InnoDB第一次分配32個頁給這個段,此後,InnoDB開始分配整個區段給這個段,InnoDB可以一次性添加4個區段給一個大的段,從而確保數據存儲時能有一個良好的順序性

2.4.InnoDB引擎內部知識及說明

InnoDB的表空間分為共用表空間和獨立表空間(推薦)兩種,表空間里存放數據的最小單位是頁,每個頁的預設值為16KB;多個連續的頁(預設是64個)組成一個區段;而多個區段和頁構成一個段。初始時,InnoDB首先會為每個段分配32個頁,之後根據實際需要再將區段分配給段,InnoDB可以一次性添加4個區給一個大的段,從而確保數據存儲時能有一個良好的順序性。

2.5.InnoDB備份相關名詞

InnoDB日誌及Xtrabackup備份原理所涉及的辭彙知識:

相關名詞 說明
redo日誌 redo日誌,也稱為事務日誌,是InnoDB引擎的重要組成部分,作用是記錄InnoDB引擎中每一個數據發生的變化信息。主要用於保證InnoDB數據的完整性,以及丟失數據後的恢復,同時還可以有效提升資料庫的IO等性能。redo日誌對應的配置參數為innodb_log_file_size和innodb_log_files_in_group
undo日誌 undo日誌是記錄事務的逆向邏輯操作或者逆向物理操作對應的數據變化的內容,undo日誌預設存放在共用表空間中(ibdata*文件),與redo日誌功能不同的是undo日誌主要用於回滾資料庫崩潰前未完整提交的事務數據,確保數據恢復前後是一致的
LSN LSN(log sequence number)是指日誌序列號,是一個64位的整型數字。LSN的作用是記錄redo日誌時,使用LSN唯一標識一條變化的數據
checkpoint 用來標識資料庫崩潰後,應恢復的redo日誌的起始點

3.Xtrabackup備份的工作原理

3.1.Xtrabackup恢復的工作原理

Percona Xtrabackup軟體是基於InnoDB等事務引擎自帶的redo日誌和undo日誌功能來保持備份和恢復前後數據一致性的,從而確保資料庫的數據安全可靠。在InnoDB引擎中存在一個redo日誌(事務日誌)功能。redo日誌文件會存儲每一個InnoDB表中的數據修改記錄。當InnoDB資料庫啟動時,會檢查數據文件和redo日誌文件,將已經提交到事務日誌(redo日誌文件)中的信息應用(提交)到數據文件並保存,然後根據undo日誌信息將修改過但沒有提交的數據記錄進行回滾(不提交到數據文件)。

3.2.Xtrabackup執行全備份的原理

當執行Xtrabackup程式開始備份時,Xtrabackup首先會記錄當前redo日誌的位置(即對應的LSN號),同時還會在後臺啟動一個進程持續監視redo日誌文件的變化,並將變化的信息都記錄到Xtrabackup_logfile中,之後就會針對所有的InnoDB數據文件進行備份(複製),待InnoDB數據文件備份完成之後,再執行“flush tables with read lock”命令對整個資料庫鎖表,然後備份(複製)MyISAM等非事務引擎的數據文件。待數據文件全部(包括InnoDB、MyISAM數據文件和redo日誌數據記錄)都備份完畢之後,獲取binlog二進位日誌位置點信息,最後執行unlock tables解鎖命令,恢復整個資料庫的可讀寫狀態。

3.3.Xtrabackup執行全備份恢復的過程

當執行Xtrabackup工具恢複數據時,要經過準備恢復(prepare)和實際恢復(restore)兩個步驟。在準備恢復過程結束後,InnoDB表的數據(即備份的物理文件)就恢復到了複製InnoDB文件結束時的時間點,這個時間點也是全庫鎖表複製MyISAM引擎數據時的起點,所以最終恢復的數據和資料庫的數據是一致的。全備的數據有兩部分,一部分是全備的物理文件,一部分是Xtrabackup log日誌文件。

3.4.Xtrabackup執行增量備份的過程

Innobackupex增量備份的(僅對InnoDB引擎有效)核心就是複製全備之後的InnoDB中變更的“頁”數據,複製時會以全備中xtrabackup_checkpoints文件對應的LSN號為依據,將大於給定的LSN號的頁數據(就是增量數據)進行備份,因為要比對全備的LSN號,所以第一次增量備份是基於全備的,以後實施的每一次增量備份都要基於上一次的增量備份,最終實現備份的數據是連續的、無缺失的,針對MyISAM引擎的備份依然是鎖表備份。

增量備份的過程:

首先在全備的xtrabackup_checkpoints logfile中找到並記錄最後一個checkpoint(last checkpoint LSN),然後從該LSN的位置開始複製InnoDB的redo日誌到Xtrabackup_logfile,然後開始複製全部的數據文件.ibd,待全部數據複製結束後,就停止複製logfile,增量備份的過程與全備基本類似,區別就是第二步,僅複製InnoDB中變化的頁數據,而非所有物理文件。

3.5.Xtrabackup執行增量恢復的過程

增量數據的恢復過程與全量備份的恢復過程類似,所不同的是增量恢復是以全備份數據為基礎的,增量恢復的數據主要涉及全備的數據、增量的數據、Xtrabackup_log日誌文件。恢復過程是先將增量備份中變化的頁數據應用到全備數據中,然後,讀取Xtrabackup_log應用redo數據到全備數據中,同時回滾未提交的事務。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 出現ora-31655錯誤的情況 原因:是因為不是同一個schema,導致的問題產生 解決方案: 在導入語句最後添加上remap_schema=old:new 著old是原schema,也就是導出的用戶名,new是想要導入的用戶名 如:這裡有一個expdp導出的dmp文件用戶是test_old,想要 ...
  • 以system用戶登錄,查找需要刪除的用戶: --查找用戶 select * from dba_users; --查找工作空間的路徑select * from dba_data_files; --刪除用戶drop user 用戶名稱 cascade;--刪除表空間與數據文件drop tablespa ...
  • 一,基本表的定義與刪除. 題1: 用SQL語句創建如下三張表:學生(Student),課程表(Course),和學生選課表(SC),這三張表的結構如表1-1到表1-3所示。 表1-1 Student表結構列名 說明 數據類型 約束Sno 學號 字元串,長度為7 主碼Sname 姓名 字元串,長度為1 ...
  • 一.Hadoop社區版和發行版 社區版:我們把Apache社區一直開發的Hadoop稱為社區版。簡單的說就是Apache Hadoophttp://hadoop.apache.org/ 發行版:基於Apache Hadoop的基礎上進行商業改造的解決方案,包含一系列定製的管理工具和軟體。 二.Had ...
  • SQL語句中的日期查詢 YYYY --當前年份第一天的前一天 SELECT TRUNC(SYSDATE,'yyyy') - 1 + 8 / 24 FROM DUAL 2019/12/31 上午 08:00:00 --當前年份的第一天 SELECT TRUNC(SYSDATE,'yyyy') + 8 ...
  • 北斗對時設備(GPS校時產品)在數字城市系統中的應用 北斗對時設備(GPS校時產品)在數字城市系統中的應用 京準電子科技官微——ahjzsz 綜述 隨著電腦網路的迅猛發展,網路應用已經非常普遍,眾多領域的網路系統如電力、石化、金融業(證券、銀行)、廣電業(廣播、電視)、交通業(火車、飛機)、軍事( ...
  • Cassandra資料庫通過JMX方式對外提供監控和管理服務。本文講解如何配置和開啟Cassandra的JMX服務。 環境說明 本文是基於以下版本的系統和服務: cassandra 3.11.6 openjdk 1.8.0 mx4j 3.0.2 Ubuntu 18.04.4 LTS 需要說明的是,當 ...
  • [TOC] 1. 前置知識 1.1 InnoDB 索引結構 InnoDB 索引使用的數據結構是 "B+ 樹" 。 百度百科中的結構圖: 一個 m 階 樹的幾個特點: 1. 每個節點可能有最多 m 個子節點 2. 除根結點外,每個結點至少有 個子女,根結點至少有兩個子女 3. 有 k 個子女的結點必有 ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...