原創工具binlog2sql:從MySQL binlog得到你要的SQL

来源:http://www.cnblogs.com/dfcao/archive/2016/12/07/binlog2sql.html
-Advertisement-
Play Games

binlog2sql是我開發的mysql binlog解析工具,它能幫助你從binlog得到你要的SQL。根據不同設置,你可以得到原始SQL、回滾SQL、去除主鍵的INSERT SQL等。 用途 數據回滾 主從切換後數據不一致的修複 從binlog生成標準SQL,帶來的衍生功能 安裝 使用 MySQ ...


binlog2sql是我開發的mysql binlog解析工具,它能幫助你從binlog得到你要的SQL。根據不同設置,你可以得到原始SQL、回滾SQL、去除主鍵的INSERT SQL等。

用途

  • 數據回滾
  • 主從切換後數據不一致的修複
  • 從binlog生成標準SQL,帶來的衍生功能

安裝

$ git clone https://github.com/danfengcao/binlog2sql.git
$ pip install -r requirements.txt

使用

MySQL server必須設置以下參數:

[mysqld]
server-id = 1
log_bin = /var/log/mysql/mysql-bin.log
max_binlog_size = 1000M
binlog-format = row

 

基本用法

解析出標準SQL

$ python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -d dbname -t table1 table2 --start-file='mysql-bin.000002' --start-pos=1240

輸出:
INSERT INTO d(`did`, `updateTime`, `uid`) VALUES (18, '2016-12-07 14:01:14', 4);
INSERT INTO c(`id`, `name`) VALUES (0, 'b');
UPDATE d SET `did`=17, `updateTime`='2016-12-07 14:01:14', `uid`=4 WHERE `did`=18 AND `updateTime`='2016-12-07 14:01:14' AND `uid`=4 LIMIT 1;
DELETE FROM c WHERE `id`=0 AND `name`='b' LIMIT 1;

 

解析出回滾SQL

$ python binlog2sql.py --flashback -h127.0.0.1 -P3306 -uadmin -p'admin' -d dbname -t table1 table2 --start-file='mysql-bin.000002' --start-pos=1240

輸出:
INSERT INTO c(`id`, `name`) VALUES (0, 'b');
UPDATE d SET `did`=18, `updateTime`='2016-12-07 14:01:14', `uid`=4 WHERE `did`=17 AND `updateTime`='2016-12-07 14:01:14' AND `uid`=4 LIMIT 1;
DELETE FROM c WHERE `id`=0 AND `name`='b' LIMIT 1;
DELETE FROM d WHERE `did`=18 AND `updateTime`='2016-12-07 14:01:14' AND `uid`=4 LIMIT 1;

 

選項

mysql連接配置

-h host; -P port; -u user; -p password

解析模式

--realtime 持續同步binlog。可選。不加則同步至執行命令時最新的binlog位置。

--popPk 對INSERT語句去除主鍵。可選。

-B, --flashback 生成回滾語句。可選。與realtime或popPk不能同時添加。

解析範圍控制

--start-file 起始解析文件。必須。

--start-pos start-file的起始解析位置。可選。預設為start-file的起始位置;

--end-file 末尾解析文件。可選。預設為start-file同一個文件。若解析模式為realtime,此選項失效。

--end-pos end-file的末尾解析位置。可選。預設為end-file的最末位置;若解析模式為realtime,此選項失效。

對象過濾

-d, --databases 只輸出目標db的sql。可選。預設為空。

-t, --tables 只輸出目標tables的sql。可選。預設為空。

應用案例

主從切換後數據不一致的修複,詳細描述可參見example/FixOldMasterExtraData.md

1. 提取old master未同步的數據,並對其中的insert語句去除主鍵(為了防止步驟3中出現主鍵衝突)

$ python binlog2sql.py --popPk -h10.1.1.1 -P3306 -uadmin -p'admin' --start-file='mysql-bin.000040' --start-pos=125466 --end-file='mysql-bin.000041' > oldMaster.sql

2. 將old master回滾,開啟同步。同步正常;

$ python binlog2sql.py --flashback -h10.1.1.1 -P3306 -uadmin -p'admin' --start-file='mysql-bin.mysql-bin.000040' --start-pos=125466 --end-file='mysql-bin.000041' | mysql -h10.1.1.1 -P3306 -uadmin -p'admin'

3. 在new master重新導入改造後的sql;

$ mysql -h10.1.1.2 -P3306 -uadmin -p'admin' < oldMaster.sql

限制

  • mysql server必須開啟,離線模式下不能解析binlog
  • binlog格式必須是行模式
  • flashback模式只支持DML,DDL將不做輸出
  • flashback模式,一次性處理的binlog不宜過大,不能超過記憶體大小(有待優化)
  • 目前已測試環境
    • Python 2.7
    • MySQL 5.6

優點(對比mysqlbinlog)

  • 純Python開發,安裝與使用都很簡單
  • 自帶flashback、popPk解析模式,無需再裝補丁
  • 解析為標準SQL,方便理解、調試
  • 代碼容易改造,可以支持更多個性化解析

聯繫我

有任何問題,請與我聯繫 [email protected]

歡迎關註binlog2sql (github.com/danfengcao/binlog2sql)

參考資料

[1] 彭立勛, MySQL下實現閃回的設計思路

[2] __七把刀__, MySQL binlog格式解析

[3] noplay, Pure Python Implementation of MySQL replication protocol build on top of PyMYSQL


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、BFC與IFC 1.1、BFC與IFC概要 BFC(Block Formatting Context)即“塊級格式化上下文”, IFC(Inline Formatting Context)即行內格式化上下文。常規流(也稱標準流、普通流)是一個文檔在被顯示時最常見的佈局形態。一個框在常規流中必須屬 ...
  • 網上搜集了css3對不同系統手機瀏覽器的支持情況(ios/android/winphone)備份一下以便查看. 以下資料由微信產品部"白樹"整理, 轉載請註明.√:完全支持 √:部分支持 ×:不支持 (-webkit):添加-webkit首碼才支持 (-ms):添加 -ms首碼才支持 css3總結: ...
  • /* Mark 1 的原理:判斷點擊事件發生在區域外的條件是:1. 點擊事件的對象不是目標區域本身2. 事件對象同時也不是目標區域的子元素*/ 原文地址:https://segmentfault.com/q/1010000000452465 ...
  • 1.在頁面中加入canvas元素 eg: 註意:上面的代碼中增加了值為“diagonal”的ID特性,這樣做可以方便以後通過ID來快速找到canvas元素,對於任何cnavas對象來說,ID特性都是十分重要的,因為對canvas元素的所有操作都是通過腳本代碼控制的,沒有ID的話,想要找到要操作的ca ...
  • 前幾天剛剛註冊了博客園,我想寫一些技巧性的教程,今天給大家分享一個MySQL同步常見問題解答。 Q:如果主伺服器正在運行並且不想停止主伺服器,怎樣配置一個從伺服器? A:有多種方法。如果你在某時間點做過主伺服器備份並且記錄了相應快照的二進位日誌名和偏移量(通過SHOW MASTER STATUS命令 ...
  • 準備工作 註意 mysqldump.exe是MySQL資料庫伺服器的導出數據工具(登錄對應mysql.exe) 1.數據備份 將資料庫伺服器中的數據保存在本地的SQL文件中 mysqldump.exe –h主機名 [–p埠號] –u用戶名 –p密碼 [-d] dbname [tablename] ...
  • 1. 背景 Ubuntu下的mysql安裝教程很多,但是有不少講得過於簡單,沒有考慮到安全問題。比如說,一些教程里,只設置一個root用戶,並且對外網公開,一來容易被破解密碼(用戶名固定,破解難度自然降了一大截,而且總有很多用戶設置的密碼不算複雜),二來,一旦密碼被破解,所有使用該資料庫的網站都遭殃 ...
  • 1. 背景 通常情況下,能用一條sql語句完成的查詢,我們儘量不用多次查詢完成。因為,查詢次數越多,通信開銷越大。但是,分多次查詢,有可能提高緩存命中率。到底使用一個複合查詢還是多個獨立查詢,需要根據實際情況考慮。 2. 一個場景 我們有A、B兩張表,需要做這樣的一個查詢: 當然,我們也可以拆分成兩 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...