CloudCanal實戰-五分鐘搞定Oracle到StarRocks數據遷移與同步

来源:https://www.cnblogs.com/clougence/archive/2022/12/23/17000154.html
-Advertisement-
Play Games

簡述 CloudCanal當前最新版本已經支持源端Oracle、SqlServer等主流傳統資料庫作為源端遷移同步數據到StarRocks來構建實時數倉。本文簡要介紹如何快速構建一條Oracle->StarRocks數據鏈路。 技術要點 基於StreamLoad的導入方式 CloudCanal 採用 ...


簡述

CloudCanal當前最新版本已經支持源端Oracle、SqlServer等主流傳統資料庫作為源端遷移同步數據到StarRocks來構建實時數倉。本文簡要介紹如何快速構建一條Oracle->StarRocks數據鏈路。

技術要點

基於StreamLoad的導入方式

CloudCanal 採用了 StreamLoad 的方式進行導入,源端的消息會轉成位元組流,最後會以批量發送的形式通過 HTTP 協議發往 StarRocks。
CloudCanal 預設採用 json 格式來進行StreamLoad導入,如果用戶內容特殊字元較少,也可以開啟 csv 格式導入,分隔符可以通過參數 columnSeparator 和 lineSeparator 設置。
基於 StreamLoad 的寫入方式,實際寫入對端的操作均為 INSERT,CloudCanal 同步時會自動將 UPDATE / DELETE 轉成 INSERT 語句,並修改 __op 值,StarRocks會自動進行數據合併。

支持常用DDL實時同步

Oracle -> StarRocks 支持新增列、刪除列DDL。DDL實時同步到對端時會自動轉換成StarRocks相容的語法,數據類型也會根據映射關係進行自動轉換。

編輯訂閱功能

CloudCanal 提供了便利的修改訂閱能力。對於一個已經創建好的正在運行的增量同步任務,如果由於業務需求有新增表需要訂閱,可以在原有任務的基礎上新增需要訂閱的表,生成子任務,自動完成全量、增量遷移同步,在完成後會子任務會自動與原有的任務合併。

數據類型映射

CloudCanal結構遷移和數據遷移同步時會自動進行數據類型映射。類型映射見下表:

Oracle類型 StarRocks類型
CHAR VARCHAR
NCHAR VARCHAR
VARCHAR2 VARCHAR
NVARCHAR VARCHAR
NVARCHAR2 VARCHAR
LONG STRING
NUMBER_BIGINT BIGINT
NUMBER_DECIMAL DECIMAL
FLOAT FLOAT
BINARY_FLOAT DECIMAL
BINARY_DOUBLE DECIMAL
CLOB STRING
NCLOB STRING
DATA DATETIME
TIMESTAMP DATETIME
TIMESTAMP_WITH_TIME_ZONE DATETIME
TIMESTAMP_WITH_LOCAL_TIME_ZONE DATETIME
INTERVAL_YEAR_TO_MONTH DATETIME
INTERVAL_DAY_TO_SECOND DATETIME
ROWID STRING
PLSQL_BOOLEAN BOOLEAN
XMLTYPE STRING
HTTPURITYPE STRING

操作示例

準備CloudCanal

  • 安裝好CloudCanal
  • 準備好源端和目標端資料庫及對應數據

Oracle源端前置準備

CloudCanal在做Oracle作為源端的數據遷移同步時,需要做一些前置準備。具體可以參考 ORACLE LogMiner同步準備

添加數據源

  • 登錄CloudCanal平臺
  • 數據源管理->添加數據源

image.png

  • 創建源端數據源:選擇自建數據源,選擇Oracle,並填寫相關資料庫信息,點擊新增數據源確定創建Oracle數據源。
    • logminerUser:ORACLE源端增量任務使用redo解析(logminer)方式時使用的賬號,需要CDB類型用戶
    • logminerPasswd:ORACLE源端增量任務使用redo解析(logminer)方式時使用的賬號密碼
    • logminerConnectType:ORACLE源端增量任務使用redo解析(logminer)方式時使用的連接方式,目前支持ORACLE_SID或ORACLE_SERVICE模式
    • logminerSidOrService:ORACLE源端增量任務使用redo解析(logminer)方式時使用的連接標識符,和logminerConnectType參數配合使用,ORACLE_SID連接方式,則填寫sid,ORACLE_SERVICE連接方式,則填寫service name

image.png

  • 創建目的端數據源:選擇自建數據源,選擇StarRocks,並填寫相關資料庫信息,點擊新增數據源確定創建StarRocks數據源

image.png

  • Client地址:StarRocks提供的MySQLClient服務埠,CloudCanal主要用其查詢庫表的元數據信息,對應StarRocks的QueryPort,預設埠為9030
  • Http地址:Http地址主要用於接收streamload的http請求。此處可以填寫StarRocks BE節點的埠,預設為8030;如需負載均衡也支持直接填寫FE的地址和埠,StarRocks的FE會自動處理stream load的http請求
  • 查看數據源是否創建成功

image.png

任務創建

  • 任務管理->創建任務

image.png

  • 選擇集群
  • 源端選擇剛添加的Oracle數據源,目標端選擇StarRocks數據源,分別點擊測試連接按鈕以測試資料庫連通性和獲取schema級別元信息,顯示連接成功後,設置資料庫映射關係
  • StarRocks的結構遷移支持用戶自定義分桶數等自定義建表信息
  • 點擊下一步

image.png

  • 選擇增量同步,並且勾選全量初始化
  • 點擊下一步

image.png

  • 選擇訂閱的表
  • 點擊下一步

image.png

  • 配置列映射
  • 點擊下一步

image.png

  • 點擊創建任務

image.png

  • 任務創建成功並啟動後,會自動執行結構遷移、全量遷移、增量同步

image.png

總結

本文簡單介紹瞭如何使用CloudCanal進行Oracle->StarRocks 數據遷移同步。各位讀者朋友,如果你覺得還不錯,請點贊、評論加轉發吧。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前幾篇博文中介紹了Transformer,由於其優越的性能表現,在工業界使用的越來越廣泛,同時,配合遷移學習理論,越來越多的Transformer預訓練模型和源碼庫逐漸開源,Huggingface就是其中做的最為出色的一家機構。Huggingface是一家在NLP社區做出傑出貢獻的紐約創業公司,其所... ...
  • 歷時9個月的時間,對iNeuOS工業互聯網操作系統進行全面重構,發佈內部測試版本。重構的主要目的:工程化的框架優化,更好的聚焦工業領域業務發展。重構也是保障產品能夠可持續發展的重要手段,同時兼顧產品的安全性和穩定性。 ...
  • 目錄 一、什麼是dapper 二、實現問題與思路 & 源碼參考 三、小結 一、什麼是dapper dapper是個組件,一個dll文件,可以通過NuGet下載。 作用:快速訪問資料庫並自動完成資料庫表對象到C#類對象的欄位映射。 應用:對於要完成簡單的查詢、報表之類的應用是非常快捷、方便的。 比較: ...
  • 摘要:為解決用戶自定義處理設備數據以及自定義協議設備快速接入IOT平臺的訴求,華為IoT邊緣提供ModuleSDK,用戶可通過集成SDK讓設備以及設備數據快速上雲。 本文分享自華為雲社區《【華為雲IoTEdge開發實戰】Java開發如何通過IoT邊緣ModuleSDK進行進程應用的開發》,作者: 華 ...
  • 0.腳本作者 Lucifer([email protected]) yuanzijian([email protected]) 1.達夢一鍵安裝腳本完整版附件內容(附件在本文末尾) 1.1.腳本文件夾soft 1.DMShellInstall:資料庫安裝腳本,詳細使用看README.md2.DMCh ...
  • 如有問題請及時指正 select version(); 數據準備 -- 1.學生表 -- S# 學生編號,Sname 學生姓名,Sage 出生年月,Ssex 學生性別 CREATE TABLE `Student` ( `S#` varchar(10) NOT NULL, `Sname` varcha ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者:蟹黃瓜子 文章來源:社區投稿 1.基於四層+七層的負載均衡 實現負載均衡的方式有很多,例如基於DNS的負載均衡、基於四層交換技術的負載均衡、基於七 ...
  • 摘要:使用動態 SQL 並非一件易事,但藉助可用於任何 SQL 映射語句中的強大的動態 SQL 語言,MyBatis 顯著地提升了這一特性的易用性。 本文分享自華為雲社區《MyBatis詳解 - 動態SQL使用與原理》,作者:龍哥手記 。 動態 SQL 是 MyBatis 的強大特性之一。如果你使用 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...