聊聊分散式 SQL 資料庫Doris(四)

来源:https://www.cnblogs.com/zhiyong-ITNote/archive/2023/11/22/17848846.html
-Advertisement-
Play Games

FE層的架構都能在網上找到說明. 但BE層的架構模式、一致性保障、與FE層之間的請求邏輯,數據傳輸邏輯等,我個人暫時沒有找到相應的博客說明這些的。當然這些是我個人在學習與使用Doris過程中,對內部交互邏輯與實現感興趣才有這些疑問. 還好現在有GPT這類大模型,有了疑問,只要問題描述得當,大多可以解 ...


FE層的架構都能在網上找到說明. 但BE層的架構模式、一致性保障、與FE層之間的請求邏輯,數據傳輸邏輯等,我個人暫時沒有找到相應的博客說明這些的。當然這些是我個人在學習與使用Doris過程中,對內部交互邏輯與實現感興趣才有這些疑問. 還好現在有GPT這類大模型,有了疑問,只要問題描述得當,大多可以解惑.

BE節點選擇策略

FE(Frontend)節點與 BE(Backend)節點之間的通信是通過 HTTP 協議進行的。

以下是 FE 節點選擇 BE 節點的一般策略:

  1. 負載均衡: FE 節點會考慮集群中各個 BE 節點的負載情況,選擇負載相對較低的節點來發送請求。這有助於確保集群資源得到均勻利用,避免出現單一節點負載過高的情況。

  2. 數據分佈: Doris 使用分區來存儲數據,FE 節點在執行查詢請求時通常會選擇負責相應分區的 BE 節點。這樣可以最大程度地減少數據的傳輸和處理時間,提高查詢效率。

  3. Replication 策略: 如果表的 replication_allocation 屬性配置了多個副本和相應的節點信息,FE 節點可能會考慮選擇其中一個副本所在的 BE 節點。這也涉及到數據的複製和容錯機制。

  4. 故障容忍: FE 節點需要考慮 BE 節點的健康狀態。如果某個 BE 節點出現故障,FE 節點可能會選擇其他正常的節點來發送請求。這也與 Raft 協議中的 Leader-Follower 模型有關,查詢和寫入請求通常由 Leader 節點處理。

  5. 就近原則: FE 節點可能會選擇距離較近的 BE 節點,以減少網路延遲。這對於提高查詢和寫入的響應速度至關重要。

這些策略和配置項通常是 Doris 內部的機制,直接由系統管理。在一般情況下,用戶無需手動配置 BE 節點的選擇策略,而是通過合理配置表的副本和集群的負載均衡機制來實現。

副本

在創建表時,可以指定BE層的節點副本配置. 個人覺得這個博客寫得蠻詳細,可以詳細的看看 數據分佈和副本

BE節點數據一致性

BE節點上,有著眾多的Tablet副本,存儲結構如下所示:
1.jpg

這些副本的數據一致性是如何保障的?BE節點集群是主副本架構麽?是否有可能存在查詢數據時,從BE中返回不到數據,因為此時BE節點的tablet還未從其他節點同步數據過來.

如下是文心一言的回答:

在Apache Doris中,BE節點間的數據一致性是通過副本同步和增量同步機制實現的。

首先,Apache Doris支持基於Paxos協議的分散式鎖機制,確保在寫入數據時,所有BE節點都能獲得相同的鎖信息。當一個BE節點獲得寫入許可權並完成數據寫入後,它會將修改操作記錄到本地日誌中,並利用Paxos協議將日誌同步到其他BE節點。其他BE節點在接收到日誌後,會根據日誌內容對數據進行相應的修改,以保證所有節點數據的一致性。

其次,Apache Doris還支持基於時間戳的數據掃描機制,定期掃描不同節點上的數據,發現不一致的情況及時進行修複。當發現數據不一致時,BE節點會利用Paxos協議重新協商一致性,並根據協商結果進行數據修複。

此外,Apache Doris還提供了多種數據同步配置項,用戶可以根據實際需求進行設置和調整,以滿足不同的業務場景和性能需求。例如,用戶可以設置同步的副本數、同步延遲時間等參數,以確保BE節點間的數據一致性。

總之,Apache Doris通過副本同步和增量同步機制以及多種數據同步配置項的結合使用,實現了BE節點間的數據一致性保證。這些機制的結合使用使得Apache Doris在分散式環境下能夠提供可靠的數據一致性保證。

如下是ChatGPT的回答:

在 Apache Doris 中,BE(Backend)節點間的數據一致性是通過 Raft 一致性協議來實現的。Raft 協議是一種分散式一致性演算法,用於確保在集群中的多個節點之間維持數據的強一致性。

以下是 BE 節點間數據一致性的基本流程:

1. Raft 組(Replica Group): Doris 中的每個表都會被分為多個 Raft 組,每個 Raft 組包含一個 Leader 節點和多個 Followers 節點。Leader 負責處理寫入請求,而 Followers 節點負責複製 Leader 的數據。

2. Leader-Follower 模型: 在每個 Raft 組中,有一個節點被選為 Leader,其他節點成為 Followers。Leader 節點接收客戶端的寫入請求,並負責將這些寫入請求的變更複製到 Followers 節點。

3. 寫入請求的處理: 當 Leader 節點接收到寫入請求時,它會將這個寫入請求的變更記錄到其本地日誌,並通過 Raft 協議將這個變更通知給 Followers 節點。

4. Quorum Commit: 在 Raft 協議中,寫入操作需要在 Leader 和大多數 Followers 節點上完成才算成功。Leader 將等待大多數節點確認成功後,再向客戶端返回寫入成功的響應。

5. Followers 數據同步: Followers 節點接收到 Leader 的寫入請求後,會將這些變更應用到本地的存儲中,確保所有節點上的數據保持一致。

6. Leader 故障轉移: 如果 Leader 節點發生故障,Raft 協議會進行新一輪的選舉,選擇新的 Leader 節點。這確保了即使在節點故障的情況下,數據仍然能夠得到一致性的維護。

通過 Raft 協議,Doris 確保了 BE 節點之間的數據一致性。這包括對寫入操作的 Quorum Commit、Leader-Follower 模型以及節點故障時的 Leader 重新選舉等機制。Raft 協議的設計目標是在分散式環境下提供強一致性,確保數據的可靠性和一致性。

最後在github上提了個discussions,期待回覆吧.


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 咱們在玩arduino或stm32、esp8266時,有時會遇到板子模擬口不夠用的情況,這個時候CD74HC4067就派上用場了,它可以將16路數字/模擬信號通過4數字+1模擬=5口來讀取。 ...
  • 這篇繼續介紹遙控小車的驅動端, 即電機驅動板, 分別介紹整體流程, 基於74HC595的IO擴展和麥克納姆輪運動控制計算等. ...
  • 1. 什麼是資料庫 資料庫是結構化信息或數據(一般以電子形式存儲在電腦系統中)的有組織的集合,通常由資料庫管理系統 (DBMS) 來控制。在現實中,數據、DBMS 及關聯應用一起被稱為資料庫系統,通常簡稱為資料庫。 為了提高數據處理和查詢效率,當今最常見的資料庫通常以行和列的形式將數據存儲在一系列 ...
  • MySQL介紹 相關概念 DB(DataBase)資料庫。是一個存儲數據的容器 DBA(Database Administrator):資料庫管理員。負責資料庫的管理和維護的專業人員 DBMS(Database Management System):資料庫管理系統。是一種軟體,用於創建和管理資料庫。 ...
  • sql(Structured Query Language: 結構化查詢語言)是高級的費過程化編程語言,允許用戶在高層數據結構上工作, 是一種數據查詢和程式設計語言, 也是(ANSI)的一項標準的電腦語言. but... 目前仍然存在著許多不同版本的sql語言,為了與ANSI標準相相容, 它們必須... ...
  • 環境說明:阿裡雲ECS,2核2G(新老用戶同享,僅需99/年),X86架構,CentOS 7.9操作系統。 準備工作 1.查看當前伺服器是否安裝了mariadb,如果有安裝需要先刪除,如下圖所示。 # 檢查當前伺服器是否安裝mariadb rpm -qa |grep mariadb # 卸載已安裝的 ...
  • 近日,CCF TF 舉辦了第 123 期分享活動,本期主題為“用戶體驗工程”。在活動中,來自火山引擎 AB 測試平臺的專家結合位元組跳動的 AB 實驗經驗,進行了《數據驅動的實驗文化》為主題的現場分享。 ...
  • 相信大家都認可一個觀點:不論是 To B 還是 To C,用戶是企業的核心資源,是互聯網產品中最重要的價值之一。因此,深入挖掘用戶價值成為現在大部分企業運營的關鍵。 之前我們為大家介紹過如何利用 RFM 模型讓企業聚焦於更有價值的用戶,本文將為大家詳細介紹用戶生命周期模型 APMDR,以及「袋鼠雲客 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...