聊聊分散式 SQL 資料庫Doris(四)

来源:https://www.cnblogs.com/zhiyong-ITNote/archive/2023/11/22/17848846.html
-Advertisement-
Play Games

FE層的架構都能在網上找到說明. 但BE層的架構模式、一致性保障、與FE層之間的請求邏輯,數據傳輸邏輯等,我個人暫時沒有找到相應的博客說明這些的。當然這些是我個人在學習與使用Doris過程中,對內部交互邏輯與實現感興趣才有這些疑問. 還好現在有GPT這類大模型,有了疑問,只要問題描述得當,大多可以解 ...


FE層的架構都能在網上找到說明. 但BE層的架構模式、一致性保障、與FE層之間的請求邏輯,數據傳輸邏輯等,我個人暫時沒有找到相應的博客說明這些的。當然這些是我個人在學習與使用Doris過程中,對內部交互邏輯與實現感興趣才有這些疑問. 還好現在有GPT這類大模型,有了疑問,只要問題描述得當,大多可以解惑.

BE節點選擇策略

FE(Frontend)節點與 BE(Backend)節點之間的通信是通過 HTTP 協議進行的。

以下是 FE 節點選擇 BE 節點的一般策略:

  1. 負載均衡: FE 節點會考慮集群中各個 BE 節點的負載情況,選擇負載相對較低的節點來發送請求。這有助於確保集群資源得到均勻利用,避免出現單一節點負載過高的情況。

  2. 數據分佈: Doris 使用分區來存儲數據,FE 節點在執行查詢請求時通常會選擇負責相應分區的 BE 節點。這樣可以最大程度地減少數據的傳輸和處理時間,提高查詢效率。

  3. Replication 策略: 如果表的 replication_allocation 屬性配置了多個副本和相應的節點信息,FE 節點可能會考慮選擇其中一個副本所在的 BE 節點。這也涉及到數據的複製和容錯機制。

  4. 故障容忍: FE 節點需要考慮 BE 節點的健康狀態。如果某個 BE 節點出現故障,FE 節點可能會選擇其他正常的節點來發送請求。這也與 Raft 協議中的 Leader-Follower 模型有關,查詢和寫入請求通常由 Leader 節點處理。

  5. 就近原則: FE 節點可能會選擇距離較近的 BE 節點,以減少網路延遲。這對於提高查詢和寫入的響應速度至關重要。

這些策略和配置項通常是 Doris 內部的機制,直接由系統管理。在一般情況下,用戶無需手動配置 BE 節點的選擇策略,而是通過合理配置表的副本和集群的負載均衡機制來實現。

副本

在創建表時,可以指定BE層的節點副本配置. 個人覺得這個博客寫得蠻詳細,可以詳細的看看 數據分佈和副本

BE節點數據一致性

BE節點上,有著眾多的Tablet副本,存儲結構如下所示:
1.jpg

這些副本的數據一致性是如何保障的?BE節點集群是主副本架構麽?是否有可能存在查詢數據時,從BE中返回不到數據,因為此時BE節點的tablet還未從其他節點同步數據過來.

如下是文心一言的回答:

在Apache Doris中,BE節點間的數據一致性是通過副本同步和增量同步機制實現的。

首先,Apache Doris支持基於Paxos協議的分散式鎖機制,確保在寫入數據時,所有BE節點都能獲得相同的鎖信息。當一個BE節點獲得寫入許可權並完成數據寫入後,它會將修改操作記錄到本地日誌中,並利用Paxos協議將日誌同步到其他BE節點。其他BE節點在接收到日誌後,會根據日誌內容對數據進行相應的修改,以保證所有節點數據的一致性。

其次,Apache Doris還支持基於時間戳的數據掃描機制,定期掃描不同節點上的數據,發現不一致的情況及時進行修複。當發現數據不一致時,BE節點會利用Paxos協議重新協商一致性,並根據協商結果進行數據修複。

此外,Apache Doris還提供了多種數據同步配置項,用戶可以根據實際需求進行設置和調整,以滿足不同的業務場景和性能需求。例如,用戶可以設置同步的副本數、同步延遲時間等參數,以確保BE節點間的數據一致性。

總之,Apache Doris通過副本同步和增量同步機制以及多種數據同步配置項的結合使用,實現了BE節點間的數據一致性保證。這些機制的結合使用使得Apache Doris在分散式環境下能夠提供可靠的數據一致性保證。

如下是ChatGPT的回答:

在 Apache Doris 中,BE(Backend)節點間的數據一致性是通過 Raft 一致性協議來實現的。Raft 協議是一種分散式一致性演算法,用於確保在集群中的多個節點之間維持數據的強一致性。

以下是 BE 節點間數據一致性的基本流程:

1. Raft 組(Replica Group): Doris 中的每個表都會被分為多個 Raft 組,每個 Raft 組包含一個 Leader 節點和多個 Followers 節點。Leader 負責處理寫入請求,而 Followers 節點負責複製 Leader 的數據。

2. Leader-Follower 模型: 在每個 Raft 組中,有一個節點被選為 Leader,其他節點成為 Followers。Leader 節點接收客戶端的寫入請求,並負責將這些寫入請求的變更複製到 Followers 節點。

3. 寫入請求的處理: 當 Leader 節點接收到寫入請求時,它會將這個寫入請求的變更記錄到其本地日誌,並通過 Raft 協議將這個變更通知給 Followers 節點。

4. Quorum Commit: 在 Raft 協議中,寫入操作需要在 Leader 和大多數 Followers 節點上完成才算成功。Leader 將等待大多數節點確認成功後,再向客戶端返回寫入成功的響應。

5. Followers 數據同步: Followers 節點接收到 Leader 的寫入請求後,會將這些變更應用到本地的存儲中,確保所有節點上的數據保持一致。

6. Leader 故障轉移: 如果 Leader 節點發生故障,Raft 協議會進行新一輪的選舉,選擇新的 Leader 節點。這確保了即使在節點故障的情況下,數據仍然能夠得到一致性的維護。

通過 Raft 協議,Doris 確保了 BE 節點之間的數據一致性。這包括對寫入操作的 Quorum Commit、Leader-Follower 模型以及節點故障時的 Leader 重新選舉等機制。Raft 協議的設計目標是在分散式環境下提供強一致性,確保數據的可靠性和一致性。

最後在github上提了個discussions,期待回覆吧.


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 咱們在玩arduino或stm32、esp8266時,有時會遇到板子模擬口不夠用的情況,這個時候CD74HC4067就派上用場了,它可以將16路數字/模擬信號通過4數字+1模擬=5口來讀取。 ...
  • 這篇繼續介紹遙控小車的驅動端, 即電機驅動板, 分別介紹整體流程, 基於74HC595的IO擴展和麥克納姆輪運動控制計算等. ...
  • 1. 什麼是資料庫 資料庫是結構化信息或數據(一般以電子形式存儲在電腦系統中)的有組織的集合,通常由資料庫管理系統 (DBMS) 來控制。在現實中,數據、DBMS 及關聯應用一起被稱為資料庫系統,通常簡稱為資料庫。 為了提高數據處理和查詢效率,當今最常見的資料庫通常以行和列的形式將數據存儲在一系列 ...
  • MySQL介紹 相關概念 DB(DataBase)資料庫。是一個存儲數據的容器 DBA(Database Administrator):資料庫管理員。負責資料庫的管理和維護的專業人員 DBMS(Database Management System):資料庫管理系統。是一種軟體,用於創建和管理資料庫。 ...
  • sql(Structured Query Language: 結構化查詢語言)是高級的費過程化編程語言,允許用戶在高層數據結構上工作, 是一種數據查詢和程式設計語言, 也是(ANSI)的一項標準的電腦語言. but... 目前仍然存在著許多不同版本的sql語言,為了與ANSI標準相相容, 它們必須... ...
  • 環境說明:阿裡雲ECS,2核2G(新老用戶同享,僅需99/年),X86架構,CentOS 7.9操作系統。 準備工作 1.查看當前伺服器是否安裝了mariadb,如果有安裝需要先刪除,如下圖所示。 # 檢查當前伺服器是否安裝mariadb rpm -qa |grep mariadb # 卸載已安裝的 ...
  • 近日,CCF TF 舉辦了第 123 期分享活動,本期主題為“用戶體驗工程”。在活動中,來自火山引擎 AB 測試平臺的專家結合位元組跳動的 AB 實驗經驗,進行了《數據驅動的實驗文化》為主題的現場分享。 ...
  • 相信大家都認可一個觀點:不論是 To B 還是 To C,用戶是企業的核心資源,是互聯網產品中最重要的價值之一。因此,深入挖掘用戶價值成為現在大部分企業運營的關鍵。 之前我們為大家介紹過如何利用 RFM 模型讓企業聚焦於更有價值的用戶,本文將為大家詳細介紹用戶生命周期模型 APMDR,以及「袋鼠雲客 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...