聊聊分散式 SQL 資料庫Doris(二)

来源:https://www.cnblogs.com/zhiyong-ITNote/archive/2023/11/21/17845431.html
-Advertisement-
Play Games

Doris中,Leader節點與非Leader節點和Observer節點之間的元數據高可用和一致性,是通過bdbje(全稱:Oracle Berkeley DB Java Edition)的一致性和高可用實現的。 元數據與同步流程 元數據主要存儲四類數據: 用戶數據信息. 包括資料庫, 表的sche ...


Doris中,Leader節點與非Leader節點和Observer節點之間的元數據高可用和一致性,是通過bdbje(全稱:Oracle Berkeley DB Java Edition)的一致性和高可用實現的。

元數據與同步流程

元數據主要存儲四類數據:

  1. 用戶數據信息. 包括資料庫, 表的schema, 分片信息等
  2. 各類作業信息. 如導入作業, clone作業, schemaChange作業等。
  3. 用戶及許可權信息.
  4. 集群及節點信息.

元數據同步圖:

1.png

元數據流轉如下:

  1. leader寫入元數據

    寫操作在修改leader的記憶體後,序列化為log,按照key-value格式寫入到bdbje. 其中 key 為連續的整型數字,全局唯一、遞增,作為 log id;value 即為序列化後的操作日誌,由2部分組成。OperationType為操作類型,如建庫操作、建表操作等。Writable Entity為序列化後的操作具體內容,通過反序列化該值,可以從鏡像上回放元數據操作。

    2.png

  2. 集群節點同步元數據

    日誌寫入bdbje後,bdbje會根據策略(寫多數/全寫), 將日誌複製到FE其他的follower節點。FE節點通過對bdbje中元數據日誌的reply, 修改自身的元數據記憶體鏡像,完成與leader節點的元數據同步。

  3. 元數據checkpoint持久化

    leader 節點的日誌條數達到閾值(預設 10w 條)並且滿足checkpoint線程執行周期(預設六十秒)。checkpoint 會讀取已有的 image 文件,和其之後的日誌,重新在記憶體中回放出一份新的元數據鏡像副本。然後將該副本寫入到磁碟,形成一個新的 image。之所以是重新生成一份鏡像副本,而不是將已有鏡像寫成 image,主要是考慮寫 image 加讀鎖期間,會阻塞寫操作。所以每次 checkpoint 會占用雙倍記憶體空間。

  4. image 文件生成後,leader 節點會通知其他 non-leader 節點新的 image 已生成。non-leader 主動通過 http 拉取最新的 image 文件,來更換本地的舊文件.

  5. bdbje 中的日誌,在 image 做完後,會定期刪除舊的日誌

  6. 刪除舊的磁碟元數據鏡像

總結

Leader節點修改記憶體元數據後,元數據日誌首先寫入bdbje,達到閾值後,bdbje形成一個新的DB,然後將新的DB內的日誌,在舊的image上回放,生成一個新的image,然後刪除bdbje中已經被集群節點全部同步的舊的元數據日誌。這樣周而複始。保證bdbje中的數據不會無限制得增長,也保證了image中始終保存著較新的元數據。同時,其他非leader節點,也訪問bdbje,將bdbje中的新寫入的元數據日誌,在自己記憶體中的元數據上回放。

元數據層面,Doris採用Paxos協議以及Memory + Checkpoint + Journal的機制來確保元數據的高性能及高可靠。Doris的元數據存儲是 memory -> bdbje -> checkpoint(image)。

為什麼同時需要 bdbje 和 image 鏡像呢?

  • 高性能和實時查詢: bdbje 作為嵌入式資料庫提供了高性能的元數據訪問,適用於實時的查詢和操作。它通常保存在記憶體中,可以快速地提供元數據信息。

  • 數據恢復和持久性: image 鏡像則用於實現元數據的持久化,以便在系統重啟或發生故障時,能夠使用鏡像還原元數據。這有助於確保系統的可靠性。

參考:

Apache Doris元數據管理

元數據設計文檔

元數據運維


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言 一年多沒更新博客,上一次寫此系列還是四年前,雖遲但到,沒有承諾,主打隨性,所以不存在斷更,催更,哈哈,上一篇我們細究從請求到綁定詳細原理,本篇則是探討模型綁定細節,當一個問題產生到最終解決時,回過頭我們整體分析其產生背景以及設計思路才能有所獲。好了,廢話不多說,我們開始模型綁定細節之旅。 問題 ...
  • 目錄 普冉PY32系列(一) PY32F0系列32位Cortex M0+ MCU簡介 普冉PY32系列(二) Ubuntu GCC Toolchain和VSCode開發環境 普冉PY32系列(三) PY32F002A資源實測 - 這個型號不簡單 普冉PY32系列(四) PY32F002A/003/0 ...
  • Linux基本使用和常用命令 1、登錄Linux操作系統方式 1.圖形化界面 基於x window System顯示框架開發 由KDE(類似於蘋果系統)、GNOME.v.3.0 提供圖形化桌面環境 2.虛擬控制台 文本方式(Ctrl + Alt + F3) 3.Web網頁登錄 前提是需要打開網頁控制 ...
  • 本篇介紹一個基於 PY32F002A 和 XL2400 的低成本無線遙控實現. 7通道是指6個模擬通道加一個開關通道, 模擬通道受PY32F002A的PIN腳限制, 全部用上可以做到8個, 因為我想保留SWD口, 所以只做了6個. 普通應用只需要雙搖桿加兩個雙調節, 基本夠用了. 第七個通道是一組開... ...
  • 文章記錄了作者曲折的探索過程,最終成功將AMD cpu的Thinkbook 14p筆記本電腦從Windows11 21h2版本升級到了23h2版本,而且系統的應用配置和數據基本沒變。 ...
  • SQL DELETE 語句 SQL DELETE 語句用於刪除表中的現有記錄。 DELETE 語法 DELETE FROM 表名 WHERE 條件; 註意:在刪除表中的記錄時要小心!請註意DELETE語句中的WHERE子句。WHERE子句指定應刪除哪些記錄。如果省略WHERE子句,將會刪除表中的所有 ...
  • 在 Doris 的存儲引擎規則: 表的數據是以分區為單位存儲的,不指定分區創建時,預設就一個分區. 用戶數據首先被劃分成若幹個分區(Partition),劃分的規則通常是按照用戶指定的分區列進行範圍劃分,比如按時間劃分。 在每個分區內,數據被進一步的按照Hash的方式分桶,分桶的規則是要找用戶指定的 ...
  • 本文分享自華為雲社區《GaussDB(DWS)監控工具指南(四)運算元級監控【綻放吧!GaussDB(DWS)雲原生數倉】》,作者: 幕後小黑爪 。 隨著數據量的增大和數據處理的複雜性增加,資料庫系統的性能問題變得越來越突出。應用程式對資料庫的訪問頻率和數據量也越來越大。因此,優化資料庫系統的性能成為 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...