聊聊分散式 SQL 資料庫Doris(二)

来源:https://www.cnblogs.com/zhiyong-ITNote/archive/2023/11/21/17845431.html
-Advertisement-
Play Games

Doris中,Leader節點與非Leader節點和Observer節點之間的元數據高可用和一致性,是通過bdbje(全稱:Oracle Berkeley DB Java Edition)的一致性和高可用實現的。 元數據與同步流程 元數據主要存儲四類數據: 用戶數據信息. 包括資料庫, 表的sche ...


Doris中,Leader節點與非Leader節點和Observer節點之間的元數據高可用和一致性,是通過bdbje(全稱:Oracle Berkeley DB Java Edition)的一致性和高可用實現的。

元數據與同步流程

元數據主要存儲四類數據:

  1. 用戶數據信息. 包括資料庫, 表的schema, 分片信息等
  2. 各類作業信息. 如導入作業, clone作業, schemaChange作業等。
  3. 用戶及許可權信息.
  4. 集群及節點信息.

元數據同步圖:

1.png

元數據流轉如下:

  1. leader寫入元數據

    寫操作在修改leader的記憶體後,序列化為log,按照key-value格式寫入到bdbje. 其中 key 為連續的整型數字,全局唯一、遞增,作為 log id;value 即為序列化後的操作日誌,由2部分組成。OperationType為操作類型,如建庫操作、建表操作等。Writable Entity為序列化後的操作具體內容,通過反序列化該值,可以從鏡像上回放元數據操作。

    2.png

  2. 集群節點同步元數據

    日誌寫入bdbje後,bdbje會根據策略(寫多數/全寫), 將日誌複製到FE其他的follower節點。FE節點通過對bdbje中元數據日誌的reply, 修改自身的元數據記憶體鏡像,完成與leader節點的元數據同步。

  3. 元數據checkpoint持久化

    leader 節點的日誌條數達到閾值(預設 10w 條)並且滿足checkpoint線程執行周期(預設六十秒)。checkpoint 會讀取已有的 image 文件,和其之後的日誌,重新在記憶體中回放出一份新的元數據鏡像副本。然後將該副本寫入到磁碟,形成一個新的 image。之所以是重新生成一份鏡像副本,而不是將已有鏡像寫成 image,主要是考慮寫 image 加讀鎖期間,會阻塞寫操作。所以每次 checkpoint 會占用雙倍記憶體空間。

  4. image 文件生成後,leader 節點會通知其他 non-leader 節點新的 image 已生成。non-leader 主動通過 http 拉取最新的 image 文件,來更換本地的舊文件.

  5. bdbje 中的日誌,在 image 做完後,會定期刪除舊的日誌

  6. 刪除舊的磁碟元數據鏡像

總結

Leader節點修改記憶體元數據後,元數據日誌首先寫入bdbje,達到閾值後,bdbje形成一個新的DB,然後將新的DB內的日誌,在舊的image上回放,生成一個新的image,然後刪除bdbje中已經被集群節點全部同步的舊的元數據日誌。這樣周而複始。保證bdbje中的數據不會無限制得增長,也保證了image中始終保存著較新的元數據。同時,其他非leader節點,也訪問bdbje,將bdbje中的新寫入的元數據日誌,在自己記憶體中的元數據上回放。

元數據層面,Doris採用Paxos協議以及Memory + Checkpoint + Journal的機制來確保元數據的高性能及高可靠。Doris的元數據存儲是 memory -> bdbje -> checkpoint(image)。

為什麼同時需要 bdbje 和 image 鏡像呢?

  • 高性能和實時查詢: bdbje 作為嵌入式資料庫提供了高性能的元數據訪問,適用於實時的查詢和操作。它通常保存在記憶體中,可以快速地提供元數據信息。

  • 數據恢復和持久性: image 鏡像則用於實現元數據的持久化,以便在系統重啟或發生故障時,能夠使用鏡像還原元數據。這有助於確保系統的可靠性。

參考:

Apache Doris元數據管理

元數據設計文檔

元數據運維


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言 一年多沒更新博客,上一次寫此系列還是四年前,雖遲但到,沒有承諾,主打隨性,所以不存在斷更,催更,哈哈,上一篇我們細究從請求到綁定詳細原理,本篇則是探討模型綁定細節,當一個問題產生到最終解決時,回過頭我們整體分析其產生背景以及設計思路才能有所獲。好了,廢話不多說,我們開始模型綁定細節之旅。 問題 ...
  • 目錄 普冉PY32系列(一) PY32F0系列32位Cortex M0+ MCU簡介 普冉PY32系列(二) Ubuntu GCC Toolchain和VSCode開發環境 普冉PY32系列(三) PY32F002A資源實測 - 這個型號不簡單 普冉PY32系列(四) PY32F002A/003/0 ...
  • Linux基本使用和常用命令 1、登錄Linux操作系統方式 1.圖形化界面 基於x window System顯示框架開發 由KDE(類似於蘋果系統)、GNOME.v.3.0 提供圖形化桌面環境 2.虛擬控制台 文本方式(Ctrl + Alt + F3) 3.Web網頁登錄 前提是需要打開網頁控制 ...
  • 本篇介紹一個基於 PY32F002A 和 XL2400 的低成本無線遙控實現. 7通道是指6個模擬通道加一個開關通道, 模擬通道受PY32F002A的PIN腳限制, 全部用上可以做到8個, 因為我想保留SWD口, 所以只做了6個. 普通應用只需要雙搖桿加兩個雙調節, 基本夠用了. 第七個通道是一組開... ...
  • 文章記錄了作者曲折的探索過程,最終成功將AMD cpu的Thinkbook 14p筆記本電腦從Windows11 21h2版本升級到了23h2版本,而且系統的應用配置和數據基本沒變。 ...
  • SQL DELETE 語句 SQL DELETE 語句用於刪除表中的現有記錄。 DELETE 語法 DELETE FROM 表名 WHERE 條件; 註意:在刪除表中的記錄時要小心!請註意DELETE語句中的WHERE子句。WHERE子句指定應刪除哪些記錄。如果省略WHERE子句,將會刪除表中的所有 ...
  • 在 Doris 的存儲引擎規則: 表的數據是以分區為單位存儲的,不指定分區創建時,預設就一個分區. 用戶數據首先被劃分成若幹個分區(Partition),劃分的規則通常是按照用戶指定的分區列進行範圍劃分,比如按時間劃分。 在每個分區內,數據被進一步的按照Hash的方式分桶,分桶的規則是要找用戶指定的 ...
  • 本文分享自華為雲社區《GaussDB(DWS)監控工具指南(四)運算元級監控【綻放吧!GaussDB(DWS)雲原生數倉】》,作者: 幕後小黑爪 。 隨著數據量的增大和數據處理的複雜性增加,資料庫系統的性能問題變得越來越突出。應用程式對資料庫的訪問頻率和數據量也越來越大。因此,優化資料庫系統的性能成為 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 微服務架構已經成為搭建高效、可擴展系統的關鍵技術之一,然而,現有許多微服務框架往往過於複雜,使得我們普通開發者難以快速上手並體驗到微服務帶了的便利。為瞭解決這一問題,於是作者精心打造了一款最接地氣的 .NET 微服務框架,幫助我們輕鬆構建和管理微服務應用。 本框架不僅支持 Consul 服務註 ...
  • 先看一下效果吧: 如果不會寫動畫或者懶得寫動畫,就直接交給Blend來做吧; 其實Blend操作起來很簡單,有點類似於在操作PS,我們只需要設置關鍵幀,滑鼠點來點去就可以了,Blend會自動幫我們生成我們想要的動畫效果. 第一步:要創建一個空的WPF項目 第二步:右鍵我們的項目,在最下方有一個,在B ...
  • Prism:框架介紹與安裝 什麼是Prism? Prism是一個用於在 WPF、Xamarin Form、Uno 平臺和 WinUI 中構建鬆散耦合、可維護和可測試的 XAML 應用程式框架 Github https://github.com/PrismLibrary/Prism NuGet htt ...
  • 在WPF中,屏幕上的所有內容,都是通過畫筆(Brush)畫上去的。如按鈕的背景色,邊框,文本框的前景和形狀填充。藉助畫筆,可以繪製頁面上的所有UI對象。不同畫筆具有不同類型的輸出( 如:某些畫筆使用純色繪製區域,其他畫筆使用漸變、圖案、圖像或繪圖)。 ...
  • 前言 嗨,大家好!推薦一個基於 .NET 8 的高併發微服務電商系統,涵蓋了商品、訂單、會員、服務、財務等50多種實用功能。 項目不僅使用了 .NET 8 的最新特性,還集成了AutoFac、DotLiquid、HangFire、Nlog、Jwt、LayUIAdmin、SqlSugar、MySQL、 ...
  • 本文主要介紹攝像頭(相機)如何採集數據,用於類似攝像頭本地顯示軟體,以及流媒體數據傳輸場景如傳屏、視訊會議等。 攝像頭採集有多種方案,如AForge.NET、WPFMediaKit、OpenCvSharp、EmguCv、DirectShow.NET、MediaCaptre(UWP),網上一些文章以及 ...
  • 前言 Seal-Report 是一款.NET 開源報表工具,擁有 1.4K Star。它提供了一個完整的框架,使用 C# 編寫,最新的版本採用的是 .NET 8.0 。 它能夠高效地從各種資料庫或 NoSQL 數據源生成日常報表,並支持執行複雜的報表任務。 其簡單易用的安裝過程和直觀的設計界面,我們 ...
  • 背景需求: 系統需要對接到XXX官方的API,但因此官方對接以及管理都十分嚴格。而本人部門的系統中包含諸多子系統,系統間為了穩定,程式間多數固定Token+特殊驗證進行調用,且後期還要提供給其他兄弟部門系統共同調用。 原則上:每套系統都必須單獨接入到官方,但官方的接入複雜,還要官方指定機構認證的證書 ...
  • 本文介紹下電腦設備關機的情況下如何通過網路喚醒設備,之前電源S狀態 電腦Power電源狀態- 唐宋元明清2188 - 博客園 (cnblogs.com) 有介紹過遠程喚醒設備,後面這倆天瞭解多了點所以單獨加個隨筆 設備關機的情況下,使用網路喚醒的前提條件: 1. 被喚醒設備需要支持這WakeOnL ...
  • 前言 大家好,推薦一個.NET 8.0 為核心,結合前端 Vue 框架,實現了前後端完全分離的設計理念。它不僅提供了強大的基礎功能支持,如許可權管理、代碼生成器等,還通過採用主流技術和最佳實踐,顯著降低了開發難度,加快了項目交付速度。 如果你需要一個高效的開發解決方案,本框架能幫助大家輕鬆應對挑戰,實 ...