mysql增量同步到greenplum

来源:https://www.cnblogs.com/5sdba-notes/archive/2020/04/29/12803367.html
-Advertisement-
Play Games

採用工具:maxwell+Kafka+bireme maxwell:maxwell能實時解析MySQL的binlog,並輸出json格式的數據發送到Kafka(還支持其它的消息中間件),具體參見:maxwell官網 Kafka: 一種消息中間件,在該方案中主要用於消息中轉,具體參見Kafka官網 b ...


採用工具:maxwell+Kafka+bireme

maxwell:maxwell能實時解析MySQL的binlog,並輸出json格式的數據發送到Kafka(還支持其它的消息中間件),具體參見:maxwell官網

Kafka: 一種消息中間件,在該方案中主要用於消息中轉,具體參見Kafka官網

bireme:支持Greenplum的數據增量同步工具,在寫入Greenplum的過程中,由於採用Copy模式,所以性能較高,具體參見bireme官網

大致原理就是:利用maxwell把mysql binlog解析成json,然後用kafka創建topic,然後用bireme消費,從而達到增量,增量的前提是先把數據全量同步一次,然後再增量。

全量同步初始化個人推薦dbswitch工具作者項目地址,個人測試使用體驗最佳,可以自動創建表結構,同步速度也很快。

操作步驟:

1.下載並搭建Kafka服務

2.下載並搭建maxwell服務,修改配置使其能夠連接MySQL並能向kafka寫入數據

3.下載並搭建bireme服務,修改配置使其能讀取kafka的數據並能向Greenplum寫入數據

kafka:

(1)下載安裝:

wget http://mirrors.hust.edu.cn/apache/kafka/2.5.0/kafka_2.12-2.5.0.tgz
tar -xzf kafka_2.12-2.5.0.tgz -C /usr/local

(2)配置server.properties,我的簡單配置如下:

[root@szwpldb1080 config]# cat server.properties |grep -vE '^#|^$'
broker.id=0
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/tmp/kafka-logs
num.partitions=1
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=1
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=16
log.cleanup.policy=delete
log.segment.bytes=1073741824
log.retention.check.interval.ms=3000
delete.topic.enable = true
zookeeper.connect=localhost:2181
zookeeper.connection.timeout.ms=6000
delete.topic.enable=true
group.initial.rebalance.delay.ms=0
advertised.host.name=172.18.1.150

(3)製作kafka啟停腳本(提前安裝好java):

#!/usr/bin/env bash
# chkconfig: 2345 20 80
#description: start and stop server
ZOOP_HOME=/usr/local/kafka_2.12-2.5.0/bin
JAVA_HOME=/usr/java/jdk1.8.0_221/
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
SVR_NAME
=kafka case $1 in start) echo "starting $ZOOP_HOME/$SVR_NAME ..." $ZOOP_HOME/kafka-server-start.sh /usr/local/kafka_2.12-2.5.0/config/server.properties > /tmp/kafka.logs.out& ;; stop) echo "stopping $PRO_HOME/$SVR_NAME ..." ps -ef|grep *.$SVR_NAME* |grep -v grep |awk '{print $2}' | sed -e "s/^/kill -9 /g" | sh - ;; restart) "$0" stop sleep 3 "$0" start ;; status) ps -ef|grep *.$SVR_NAME* ;; logs) tail -f /tmp/zookeeper.logs.out ;; *) echo "Example: server-$SVR_NAME [start|stop|restart|status|logs]" ;; esac

添加到 /etc/rc.d/init.d ,然後就可以直接service kafka xxx來管理,或者添加到systemd下麵,確保服務正常啟動安裝zookerper,然後啟動kafka。

我的zookeeper簡單配置如下:

[root@szwpldb1080 config]# cat zookeeper.properties |grep -Ev '^$|^#'
dataDir=/tmp/zookeeper
clientPort=2181
maxClientCnxns=0

zookeeper啟停腳本

#!/usr/bin/env bash
# chkconfig: 2345 20 80
#description: start and stop server
ZOOP_HOME=/usr/local/kafka_2.12-2.5.0/bin
JAVA_HOME=/usr/java/jdk1.8.0_221/
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

SVR_NAME=zookeeper
case $1 in 
    start)
        echo "starting $ZOOP_HOME/$SVR_NAME ..."
       $ZOOP_HOME/zookeeper-server-start.sh /usr/local/kafka_2.12-2.5.0/config/zookeeper.properties  > /tmp/zookeeper.logs.out&
        ;;
    stop)
        echo "stopping $PRO_HOME/$SVR_NAME ..."
        ps -ef|grep *.$SVR_NAME* |grep -v grep |awk '{print $2}'  | sed -e "s/^/kill -9 /g" | sh - 
        ;;
    restart)
        "$0" stop
        sleep 3
        "$0" start
        ;;
    status)
        ps -ef|grep *.$SVR_NAME*
        ;;
    logs)
        tail -f /tmp/zookeeper.logs.out
        ;;
    *)       
        echo "Example: server-$SVR_NAME [start|stop|restart|status|logs]" ;;
esac

(4)檢查狀態:

[root@szwpldb1080 config]# jps
1762 Kafka
18521 QuorumPeerMain
30383 Jps

maxwell:

(1)docker鏡像下載

docker pull zendesk/maxwell

(2)在源端mysql建好用戶設置好許可權,測試maxwell:

docker run -ti --rm zendesk/maxwell bin/maxwell --user='xxxx' --password='xxxx' --host='x.x.x.x' --producer=stdout 

看到日誌輸出正常,可以放後臺運行:

docker run -d --rm zendesk/maxwell bin/maxwell --user='xx' \
 --password='xx' --host='x.x.x.x' --port=3306\
 --producer=kafka --kafka.bootstrap.servers='x.x.x.x:9092'\
 --kafka_topic=syncdb --log_level=debug --output_ddl

然後創建kafka topic:

bin/kafka-topics.sh --create --topic syncdb --zookeeper localhost:2181 --partitions 1 --replication-factor 2

topic名字與maxwell創建的topic一致,並且由於maxwell可以解析所有binlog,但是bireme工具只能同步dml,因此沒有加 --output_ddl

具體maxwell參數用法可以參考: maxwell配置

檢查kafka消費情況:

[root@szwpldb1080 bin]# ./kafka-topics.sh --zookeeper localhost:2181 --describe --topic syncdb
Topic:syncdb    PartitionCount:1    ReplicationFactor:1    Configs:
    Topic: syncdb    Partition: 0    Leader: 0    Replicas: 0    Isr: 0
[root@szwpldb1080 bin]#./kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic syncdb --from-beginning

看到kafka能接收maxwell產生的json文件,表示沒問題。

bireme

安裝配置都很簡單,此處略過。

主要是修改以下2個配置文件。

config.properties
maxwell1.properties

然後監控 http://x.x.x.x:8080或者監控bireme日誌就可以了。

總結:

只能同步DML語句,無法處理DDL,對比幾款開源的工具已經同步方式,我覺得我這種是最舒服的。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 創建mongodb分片集群 + keyFile認證 一、環境準備 1. 伺服器節點信息【三台伺服器】 x.x.x.159、 x.x.x..160、 x.x.x..161 2. 伺服器系統 linux x86_64 GNU/Linux 或者 centos7 或者 redhat 3. mongodb版本 ...
  • 本文主要從存儲體系由來、分類以及原理角度來講解一個存儲體系的設計,努力做到全面。當然由於個人水平有限,文章難免可能會有錯誤,如若發現,懇請指出,不勝感激。 ...
  • [TOC] 1.開啟跳過許可權驗證 2.重置密碼 ...
  • [TOC] 1.下載MySQL5.7 2.上傳壓縮包,並解壓 3.配置並啟動 3.1.製作軟鏈接 3.2.配置my.cnf 3.3.創建關鍵目錄並設置許可權 3.4.初始化資料庫 3.5.複製啟動腳本到/etc/init.d/mysqld 3.6.啟動資料庫 3.7.配置環境變數 ...
  • 樹莓派入門指南 一、安裝系統 準備物品: 一張SD卡,讀卡器 樹莓派一枚(包括其供電) 軟體:Win32 disk imager 下載地址:http://wd.jb51.net:81/201408/tools/win32diskimager_cn(jb51.net).rar 樹莓派系統鏡像 下載地址 ...
  • 表現 前端頁面,封裝到html里的中文可以顯示,和後臺相關的中文顯示都是 ??? 。查看network請求,傳參正常。 查看mysql編碼,是utf8。再看連接資料庫的JDBC設置,也是utf8。 解決 問了同事,把 /etc/mysql/conf.d/mysql.cnf 填充以下內容即可 ...
  • 看到這個 故障分析 | MySQL OOM 故障應如何下手,想起來幾天前也遇到一次MySQL服務因為OOM被殺掉的情況,記錄一下 背景:一個測試環境,由於Centos系統上沒有設置虛擬記憶體,運行的MySQL實例buffer_pool_size配置的有不合理,運行了一個較大的查詢 現象:前端工具執行某 ...
  • 原因:因為甲方比較關心許可的一些問題,會經常問起,但是現場人員往往對許可的內容不太瞭解,這裡基於網路搜索的內容進行統一梳理。因為內容大多來自於網路,如果文中有描述不當的,請大家指正!一、Oracle許可說明Oracle軟體是提供免費下載的,下載安裝後均能夠正常使用。不過使用是有限制的,只可以用於測試... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...