CloudCanal實戰-五分鐘搞定Oracle到StarRocks數據遷移與同步

来源:https://www.cnblogs.com/clougence/archive/2022/12/23/17000154.html
-Advertisement-
Play Games

簡述 CloudCanal當前最新版本已經支持源端Oracle、SqlServer等主流傳統資料庫作為源端遷移同步數據到StarRocks來構建實時數倉。本文簡要介紹如何快速構建一條Oracle->StarRocks數據鏈路。 技術要點 基於StreamLoad的導入方式 CloudCanal 採用 ...


簡述

CloudCanal當前最新版本已經支持源端Oracle、SqlServer等主流傳統資料庫作為源端遷移同步數據到StarRocks來構建實時數倉。本文簡要介紹如何快速構建一條Oracle->StarRocks數據鏈路。

技術要點

基於StreamLoad的導入方式

CloudCanal 採用了 StreamLoad 的方式進行導入,源端的消息會轉成位元組流,最後會以批量發送的形式通過 HTTP 協議發往 StarRocks。
CloudCanal 預設採用 json 格式來進行StreamLoad導入,如果用戶內容特殊字元較少,也可以開啟 csv 格式導入,分隔符可以通過參數 columnSeparator 和 lineSeparator 設置。
基於 StreamLoad 的寫入方式,實際寫入對端的操作均為 INSERT,CloudCanal 同步時會自動將 UPDATE / DELETE 轉成 INSERT 語句,並修改 __op 值,StarRocks會自動進行數據合併。

支持常用DDL實時同步

Oracle -> StarRocks 支持新增列、刪除列DDL。DDL實時同步到對端時會自動轉換成StarRocks相容的語法,數據類型也會根據映射關係進行自動轉換。

編輯訂閱功能

CloudCanal 提供了便利的修改訂閱能力。對於一個已經創建好的正在運行的增量同步任務,如果由於業務需求有新增表需要訂閱,可以在原有任務的基礎上新增需要訂閱的表,生成子任務,自動完成全量、增量遷移同步,在完成後會子任務會自動與原有的任務合併。

數據類型映射

CloudCanal結構遷移和數據遷移同步時會自動進行數據類型映射。類型映射見下表:

Oracle類型 StarRocks類型
CHAR VARCHAR
NCHAR VARCHAR
VARCHAR2 VARCHAR
NVARCHAR VARCHAR
NVARCHAR2 VARCHAR
LONG STRING
NUMBER_BIGINT BIGINT
NUMBER_DECIMAL DECIMAL
FLOAT FLOAT
BINARY_FLOAT DECIMAL
BINARY_DOUBLE DECIMAL
CLOB STRING
NCLOB STRING
DATA DATETIME
TIMESTAMP DATETIME
TIMESTAMP_WITH_TIME_ZONE DATETIME
TIMESTAMP_WITH_LOCAL_TIME_ZONE DATETIME
INTERVAL_YEAR_TO_MONTH DATETIME
INTERVAL_DAY_TO_SECOND DATETIME
ROWID STRING
PLSQL_BOOLEAN BOOLEAN
XMLTYPE STRING
HTTPURITYPE STRING

操作示例

準備CloudCanal

  • 安裝好CloudCanal
  • 準備好源端和目標端資料庫及對應數據

Oracle源端前置準備

CloudCanal在做Oracle作為源端的數據遷移同步時,需要做一些前置準備。具體可以參考 ORACLE LogMiner同步準備

添加數據源

  • 登錄CloudCanal平臺
  • 數據源管理->添加數據源

image.png

  • 創建源端數據源:選擇自建數據源,選擇Oracle,並填寫相關資料庫信息,點擊新增數據源確定創建Oracle數據源。
    • logminerUser:ORACLE源端增量任務使用redo解析(logminer)方式時使用的賬號,需要CDB類型用戶
    • logminerPasswd:ORACLE源端增量任務使用redo解析(logminer)方式時使用的賬號密碼
    • logminerConnectType:ORACLE源端增量任務使用redo解析(logminer)方式時使用的連接方式,目前支持ORACLE_SID或ORACLE_SERVICE模式
    • logminerSidOrService:ORACLE源端增量任務使用redo解析(logminer)方式時使用的連接標識符,和logminerConnectType參數配合使用,ORACLE_SID連接方式,則填寫sid,ORACLE_SERVICE連接方式,則填寫service name

image.png

  • 創建目的端數據源:選擇自建數據源,選擇StarRocks,並填寫相關資料庫信息,點擊新增數據源確定創建StarRocks數據源

image.png

  • Client地址:StarRocks提供的MySQLClient服務埠,CloudCanal主要用其查詢庫表的元數據信息,對應StarRocks的QueryPort,預設埠為9030
  • Http地址:Http地址主要用於接收streamload的http請求。此處可以填寫StarRocks BE節點的埠,預設為8030;如需負載均衡也支持直接填寫FE的地址和埠,StarRocks的FE會自動處理stream load的http請求
  • 查看數據源是否創建成功

image.png

任務創建

  • 任務管理->創建任務

image.png

  • 選擇集群
  • 源端選擇剛添加的Oracle數據源,目標端選擇StarRocks數據源,分別點擊測試連接按鈕以測試資料庫連通性和獲取schema級別元信息,顯示連接成功後,設置資料庫映射關係
  • StarRocks的結構遷移支持用戶自定義分桶數等自定義建表信息
  • 點擊下一步

image.png

  • 選擇增量同步,並且勾選全量初始化
  • 點擊下一步

image.png

  • 選擇訂閱的表
  • 點擊下一步

image.png

  • 配置列映射
  • 點擊下一步

image.png

  • 點擊創建任務

image.png

  • 任務創建成功並啟動後,會自動執行結構遷移、全量遷移、增量同步

image.png

總結

本文簡單介紹瞭如何使用CloudCanal進行Oracle->StarRocks 數據遷移同步。各位讀者朋友,如果你覺得還不錯,請點贊、評論加轉發吧。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前幾篇博文中介紹了Transformer,由於其優越的性能表現,在工業界使用的越來越廣泛,同時,配合遷移學習理論,越來越多的Transformer預訓練模型和源碼庫逐漸開源,Huggingface就是其中做的最為出色的一家機構。Huggingface是一家在NLP社區做出傑出貢獻的紐約創業公司,其所... ...
  • 歷時9個月的時間,對iNeuOS工業互聯網操作系統進行全面重構,發佈內部測試版本。重構的主要目的:工程化的框架優化,更好的聚焦工業領域業務發展。重構也是保障產品能夠可持續發展的重要手段,同時兼顧產品的安全性和穩定性。 ...
  • 目錄 一、什麼是dapper 二、實現問題與思路 & 源碼參考 三、小結 一、什麼是dapper dapper是個組件,一個dll文件,可以通過NuGet下載。 作用:快速訪問資料庫並自動完成資料庫表對象到C#類對象的欄位映射。 應用:對於要完成簡單的查詢、報表之類的應用是非常快捷、方便的。 比較: ...
  • 摘要:為解決用戶自定義處理設備數據以及自定義協議設備快速接入IOT平臺的訴求,華為IoT邊緣提供ModuleSDK,用戶可通過集成SDK讓設備以及設備數據快速上雲。 本文分享自華為雲社區《【華為雲IoTEdge開發實戰】Java開發如何通過IoT邊緣ModuleSDK進行進程應用的開發》,作者: 華 ...
  • 0.腳本作者 Lucifer([email protected]) yuanzijian([email protected]) 1.達夢一鍵安裝腳本完整版附件內容(附件在本文末尾) 1.1.腳本文件夾soft 1.DMShellInstall:資料庫安裝腳本,詳細使用看README.md2.DMCh ...
  • 如有問題請及時指正 select version(); 數據準備 -- 1.學生表 -- S# 學生編號,Sname 學生姓名,Sage 出生年月,Ssex 學生性別 CREATE TABLE `Student` ( `S#` varchar(10) NOT NULL, `Sname` varcha ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者:蟹黃瓜子 文章來源:社區投稿 1.基於四層+七層的負載均衡 實現負載均衡的方式有很多,例如基於DNS的負載均衡、基於四層交換技術的負載均衡、基於七 ...
  • 摘要:使用動態 SQL 並非一件易事,但藉助可用於任何 SQL 映射語句中的強大的動態 SQL 語言,MyBatis 顯著地提升了這一特性的易用性。 本文分享自華為雲社區《MyBatis詳解 - 動態SQL使用與原理》,作者:龍哥手記 。 動態 SQL 是 MyBatis 的強大特性之一。如果你使用 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...