京東雲開發者|京東雲RDS數據遷移常見場景攻略

来源:https://www.cnblogs.com/Jcloud/archive/2022/10/28/16835071.html
-Advertisement-
Play Games

雲時代已經來臨,雲上很多場景下都需要數據的遷移、備份和流轉,各大雲廠商也大都提供了自己的遷移工具。本文主要介紹京東雲資料庫為解決用戶數據遷移的常見場景所提供的解決方案。 ...


雲時代已經來臨,雲上很多場景下都需要數據的遷移、備份和流轉,各大雲廠商也大都提供了自己的遷移工具。本文主要介紹京東雲資料庫為解決用戶數據遷移的常見場景所提供的解決方案。

場景一:數據遷移上雲

數據遷移上雲是最常見的一類場景,目前京東雲提供了兩個DTS(Data Transformation Service)遷移工具供選擇,一個是數據遷移,一個是數據同步:

二者的主要區別如下:

下麵是這兩個工具使用中的一些常見問題:

01 兩個遷移工具的原理是什麼?

以MySQL為例,兩個工具都有全量遷移/增量遷移/數據校驗三個階段,這三個階段的主要原理如下:

全量階段:

數據遷移使用mysqldump --single-transaction來取得一致性快照,但無法保證非事務引擎表的數據一致性,加上增量才可以保證數據的最終一致性,這個過程是串列操作;

數據同步使用多表並行的select方式,根據主鍵順序分批獲取記錄,迴圈執行,如果沒有主鍵,則進行全表查詢。為了最大限度減少對源實例的影響,這個過程不加鎖,也不用開啟事務獲得一致讀,因此全量期間遷移的數據是不一致的,通過增量階段可以達到最終一致性。所以數據同步只提供了‘全量+增量’和‘增量’兩種選項,不提供單獨的‘全量’選項。

增量階段:

數據遷移和數據同步一樣,都是通過遷移啟動前記錄的gtid點位,抓取對應binlog同步apply到目標端,二者區別在於遷移是串列的,同步會將同一個表的事務合併後一次提交,效率更高。

數據校驗:

將源庫的數據分塊計算crc,每個塊的元數據和校驗信息記錄到目標實例_jdts_check為首碼的庫下checksum表中。目標庫同步完成後根據同樣演算法進行計算,比較對應塊號的crc值是否一致來判斷校驗是否成功。

02 遷移速度可以調整嗎?

數據遷移不可以,數據同步可以選擇更大的遷移實例和增加更多的併發來調整,但由於併發機制是基於表粒度的,對於少量大表的情況,增加併發並不會有明顯作用。

03 遷移進度為什麼顯示超過100%?

為了效率更高,遷移顯示的進度是根據已經遷移的記錄數除以數據字典記錄的記錄數顯示,數據字典的值並不完全準確,因此理論上會出現進度超過100%的現象。

04 遷移延時為什麼很長?

大多情況是源庫寫操作壓力大導致目標庫binlog apply進度趕不上源庫的寫入速度,也有可能是目標庫讀寫壓力大或者遷移實例壓力大,具體需要聯繫京東雲技術服務及時介入。

05 遷移期間目標庫是否可以讀寫數據?

理論上可以讀寫,但不建議在遷移期間操作,主要有兩個弊端:

  • 寫入臟數據會導致校驗不一致。
  • 讀寫數據會導致目標庫壓力增大,減緩數據同步速度。

06 目標端如果有同名庫表是否會被覆蓋?

不會的,如果目標庫庫表有數據,預檢的時候會報錯不通過;如果是空的庫表,則可以直接寫入。

07 自檢提示源或目標庫網路不通怎麼辦?

檢查源庫和目標庫的白名單限制,需要加上dts遷移實例的ip,在遷移任務配置的時候會在頁面提示。

08 目標庫中的_jdts為首碼的庫可以刪除嗎?

遷移完成可以刪除。

09 可以從只讀實例同步嗎?

只要源實例是gtid方式複製的,都可以通過主實例或只讀實例同步。

10 數據遷移選擇內網時,為啥只能用json格式,不能圖形化選擇庫表?

因為數據遷移創建任務的時候,遷移實例還未創建,無法判斷內網連通性;數據同步已經做了改進,內外網均可以通過圖形化方式選擇庫表。

11 遷移期間對源實例有影響嗎?

無論數據遷移還是數據同步,都需要對源實例庫表做select,會有一定的讀IO壓力,建議儘量在業務低峰期同步或從只讀實例同步。對於數據同步任務, 可通過控制台暫停任務,待源庫負載降低,再啟動數據同步任務。

12 mysql系統庫應該如何遷移?

目前不支持遷移MySQL庫,建議用戶遷移時提前在目標庫創建配置好對應的用戶和許可權。或者通過mysqldump等工具從源庫導入。

13 遷移過程出現Got fatal error 1236 ... 的報錯怎麼辦?

這個報錯可能會在增量遷移過程出現,主要原因是增量需要的binlog在源端被刪除所致,因此遷移期間儘量將源端binlog保留較長的時間。如果出現此類報錯,如果無法找回被刪binlog,只能重新開始遷移。

14 源端目標端版本必須一致嗎?

數據遷移要求兩邊版本一致;數據同步目前支持低->高版本遷移。

場景二:異地災備

用戶經常會對數據有異地災備的需求,京東雲目前提供了兩種方式,一種是可以配置跨地域備份同步,如下圖:

這種方式簡單免費,會定期將最新備份同步到異地,缺點是數據是非實時的,如果災備恢復會有數據丟失。

另外一種方案是災備同步(目前暫只支持MySQL),可以在京東雲控制台創建一個異地災備實例,然後利用DTS的數據同步功能將災備實例和源實例進行數據同步,同步方式選擇災備同步。和普通同步機制不同,災備同步利用的是MySQL的原生複製,因此災備實例和源實例是完全一致的,相當於一個異地的只讀實例,這樣就可以達到異地災備的目的。

對於災備實例,有幾點需要註意:

  • 災備實例目前只支持和京東雲MySQL進行同步,暫不支持自建或第三方雲實例。
  • 災備實例無法進行變配/重啟/主從切換等操作,需要提前選好規格。
  • 災備實例也是主從實例,可以讀但無法進行寫操作,類似異地只讀實例,可以手工提升為主備實例。
  • 災備實例是基於dts同步的,一旦手工結束同步,災備實例將自動提升為普通主備實例。

場景三:數據訂閱

很多業務場景都會用到數據訂閱,比如訂閱數據到ES擴展搜索、上下游訂閱價格變更/服務通知、多業務庫數據合併/構建寬表等。京東雲提供了數據訂閱功能來滿足類似需求,目前源端支持
MySQL/Percona/MariaDB/PostgreSQL,目標端僅支持Kafka。

目標端使用json格式記錄訂閱信息,下麵是一個update操作的例子:

{
"version": "0.1",
"database": "dbtest",
"table": "t1",
"type": "update",
"ts": 1582617997,
"time_zone": "Asia/Shanghai",
"host": "mysql-internet-cn-north-1-c52cb616874d4d29.rds.jdcloud.com",
"data": {
"created": "2020-02-25 16:01:46",
"flag": "10691",
"info": "dts_test",
"pkid": "11663",
"uuid": "11cae53d-57a5-11ea-98a6-fa163ea31339"
},
"old": {
"created": "2020-02-25 16:01:46",
"flag": "10691",
"info": null,
"pkid": "11663",
"uuid": "11cae53d-57a5-11ea-98a6-fa163ea31339"
},
"pks": {
"pkid": "11663"
}
}

數據訂閱有幾點需要註意:

  • 訂閱的消息長度如果超過中間件的最大消息長度,消息將被丟棄,因此理論上會有丟失數據風險。
  • 目標端接受的數據起點預設為訂閱的實時時間點,如果需要全量訂閱可以聯繫京東雲技服人員。

場景四:自建MySQL和雲上MySQL相互複製

用戶經常有這樣的需求,是否可以用自建MySQL來同步雲上MySQL?或者反過來,是否可以雲上MySQL作為自建MySQL的從庫來滿足某些場景?

  • 從MySQL複製機制來看,理論上應該都是可以的,但京東雲的賬號不支持賦予super許可權,無法執行change master操作,所以雲上MySQL無法作為自建MySQL的從庫。
  • 反過來,自建MySQL可以有super許可權,是可以作為雲上MySQL的從庫。但這個是非標準操作,並不建議用戶使用。主要原因是在某些情況下,會造成複製中斷。比如雲上MySQL配置變更後需要主從切換,而此時自建從庫和切換前的源主庫有複製延遲,部分binlog還未傳遞到自建從庫,此時主從切換後復新主庫由於沒有這些binlog,會造成自建從庫報1236的錯誤。針對這種情況,用戶可以在擴容時選擇延遲切換,可以避開業務高峰,在一定程度上避免類似問題。

作者:翟振興


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、mysql 基本操作 Windows-->Mysql5.7打開 輸入用戶名和密碼 查看資料庫 :show databases;查詢所有資料庫,記住一定要加分號結尾 這裡必須全部為 英文空格 英文符號 選擇 day4_6資料庫:use day4_6; 查看這個資料庫的所有表: show table ...
  • 哈佛大學CS50系列課程分支之一,結合Python編程語言,探討現代人工智慧的基礎概念和演算法,深入探討對游戲引擎、手寫識別和機器翻譯等技術的理解和思考。 ...
  • 目錄 一.前言 二.OpenGL ES 上下文 三.OpenGL ES 狀態機 四.緩存 五.渲染 六.紋理 七.光柵化 Rasterization 八.片元著色器 九.頂點著色器 十.著⾊語言 GLSL 十一.著色器使用流程 十二.著色器的渲染流程 十三.猜你喜歡 零基礎 OpenGL ES 學習 ...
  • 摘要:本文結合圖解和問題,教你一次性搞定HashMap 本文分享自華為雲社區《java中HashMap的設計精妙在哪?用圖解和幾個問題教你一次性搞定HashMap》,作者:breakDawn。 HashMap核心原理 HashMap完整的put過程 以下是對上圖的詳細解釋: 首先,要獲取key的哈希 ...
  • 各位好啊,我是會編程的蝸牛,作為java開發者,我們都是需要接觸Linux伺服器的,一般部署應用都是部署在Linux伺服器上的~ 但一般的伺服器要麼需要購買,要麼只是公司里的,那麼有沒有免費的Linux可以讓我們自己使用呢?答案是,有的。 我們可以在自己的電腦上安裝一個虛擬機,然後就可以在虛擬機裡面... ...
  • 更多技術文章,請關註我的個人博客 www.immaxfang.com 和小公眾號 Max的學習札記。 Redis 事務簡介 Redis 只是提供了簡單的事務功能。其本質是一組命令的集合,事務支持一次執行多個命令,在事務執行過程中,會順序執行隊列中的命令,其他客戶端提交的命令請求不會插入到本事務執行命 ...
  • 閱識風雲是華為雲信息大咖,擅長將複雜信息多元化呈現,其出品的一張圖(雲圖說)、深入淺出的博文(雲小課)或短視頻(雲視廳)總有一款能讓您快速上手華為雲。更多精彩內容請單擊此處。 摘要:Hudi是數據湖的文件組織層,對Parquet格式文件進行管理提供數據湖能力,支持多種計算引擎。 本文分享自華為雲社區 ...
  • 摘要:通常在運維監控出現CPU使用率較高、P80/P95指標較高、慢SQL數量上升等現象,或者業務出現超時報錯時,優先應排查是否出現慢SQL。 本文分享自華為雲社區《GaussDB慢SQL常見定位處理手段》,作者:酷哥。 關鍵指標 通常在運維監控出現CPU使用率較高、P80/P95指標較高、慢SQL ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...