海量大數據分散式資料庫解決方案思路

来源:https://www.cnblogs.com/flyingaway/archive/2017/12/29/8143621.html
-Advertisement-
Play Games

本文以海量大數據高併發查詢,低更新操作的場景為前提,提出一個基於分散式設計的資料庫解決方案,大致介紹了資料庫的部署方案及每個節點的功能,同時對主要的查詢和更新流程做了簡單介紹,闡述了一種可能的解決思路,為大家提供一個參照。 ...


前言

  隨著互聯網的發展,分散式技術的逐漸成熟,動態水平擴展和自動容災備份、一鍵部署等技術方案不斷成熟,各大中小互聯網企業都在嘗試切換將產品的技術方案到分散式的方案,但是分散式的技術方案有一個業內比較難以解決的問題,就是分散式事務的處理,大部分都是將業務儘量限制在同庫中,避免跨庫事務,或者採用消息隊列處理分散式事務,或者採用DTC來處理,但是性能都不是太理想。在閱讀關於淘寶資料庫OceanBase的一些文章時受到啟發,想到一個不成熟的方案,也可以說是對OceanBase的一些思路的總結,在這裡寫出來給大家分享一下,也歡迎指出其中不合理或可改善的地方。

使用場景

  1.海量數據;

  2.讀取壓力大而更新操作的場景少;

  3.保障高可用,最終一致性;

架構圖

節點功能

1. Application Server 應用伺服器,這裡只畫了一臺,實際生產環境中可能是幾百上千個Host的服務,主要是業務服務;

2.Gate Gate中保持著數據中心各個功能節點的狀態信息,Application Server從Gate中獲取到需要操作的主機地址,然後再與數據中心指定的節點進行通信;Gate中保留的節點信息會記錄節點的路由ip和埠,節點的狀態,另外記錄節點的功能特點;Gate中會開一個守護進程負責與數據中心的各個節點進行通信(每個節點也有專門負責通信的守護進程),節點的可用狀態通過心跳檢測(節點是否拓機),節點是否處於busy狀態由節點自己彙報到Gate守護進程,Gate守護進程再更新配置信息;

3.Update Master 負責資料庫的更新操作,該節點並不保存所有數據,只是在需要更新時,將需要的數據從對應的查詢庫中獲取到數據,然後在本機做事務更新,完成後,也是提交到本機。並通過某種機制(定時器或達到某個閾值),就備份本機數據,並提交到Data Transfer Station,提交成功後,清空本地資料庫。這裡的難點是如果知道需要獲取哪些數據,我的初步思路是,由應用服務自己告訴該節點,這是最簡單的方式;

4.Update Slave:備用的Update伺服器,當Master拓機時自動成為Master代替UpdateMaster的工作。守護進程實時監控Master狀態;

5.Data Transfer Station 數據中轉中心,負責收集變更數據,並備份存儲,以防需要跟蹤或恢複數據等。在Update Master提交備份數據後,查找空閑的Dispatcher,再由Dispatcher拉去需要的數據,分發同步到Query Server中;

6.Dispatcher 數據分發器,分發器從Data Transfer Station獲取到數據,並從Gate中獲取空閑的、未同步過該數據的Query Server,並將該Query Server標記為同步數據中,然後同步數據,同步完成後,將同步日誌記錄,返回給Data Transfer Station,接著繼續下一個Query Server進行同步,直到所有都同步完成。完成後,Data Transfer Station將該份數據標記為所有節點已同步(同步過程中Query Server還是可以提供查詢服務);

7.Query Server 查詢伺服器,負責對外的數據查詢。這裡有一點還在考慮中,就是是否採用分片,因為數據量大,不分片肯定會導致單機的查詢效率下降,分片的話,如採用Hash演算法計算分片,會增加查詢的複雜度,最主要是,數據下發時,需要考慮該更新的數據是在哪個分片上,相對會比較複雜;

 

查詢數據請求流程圖(未使用Hash MapReduce,如果使用,則需要在過程中添加Hash計算數據所在的節點)

 

更新數據請求流程圖

 

 

這裡獲取更新數據時,應該是全量的,即Update Master里的數據+Query Server的數據+Dispatcher未分發完成的數據;舉例來說,假設查詢到的某個賬戶餘額100,000元,需要做一個轉賬業務,需要轉出10000元,並且之前已經做過一次轉賬5000元,但是這筆5000元的轉賬還未同步到查詢伺服器中,那麼該次轉賬應該是100,000元減去5,000元,然後再去做轉出10,000元的操作。最終賬戶餘額應該是85,000元。另外,如果查詢要做到強一致性,也應該這樣做一個差異性數據合併,再轉發給業務服務,這樣就能做到信息的一致性和實時性。

 

以上僅提供一種思路,實現可結合自己的業務,對該解決方案做一些更改,具體選取技術。具體細節也考慮不是很周全,如有思路上的錯誤,請多指教。

 

本文原創,如有轉載,請註明出處。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 相容性 相容性:瀏覽器相容問題和適配問題統稱為相容性問題 解決辦法 1.hack語法,控制解決辦法 <!--[if <keywords>? IE <version>?]> HTML代碼塊 <![endif]--> eg:<!--[if gt IE 6]> ...... <![endif]--> 說明 ...
  • JS實現的4種數字千位符格式化方法 所謂的數字千分位形式,即從個位數起,每三位之間加一個逗號。例如“10,000”。針對這個需求,我起初寫了這樣一個函數: // 方法一 function toThousands(num) { var result = [ ], counter = 0; num = ...
  • 呃,終於到了這地方…… MMP,有31個函數,估計可以寫到明年了。 這裡先梳理所有事件的註入來源,經檢測,全部來源於WebpackOptionsApply中,回到那個可怕的模塊,梳理後如下: 還好都集中在一個地方,這樣又可以寫流水賬了。 這裡先要過一個地方,之前似乎遺留了: 這裡註入了entry-o ...
  • 在很久之前就想通過工具來規範自己的代碼風格,減少程式出錯的概率,如果看過我的 一個前端程式猿的Sublime Text3的自我修養 ,這篇博客的朋友,肯定知道在當時我使用 SublimeLinter-jshint 插件來規範風格,但是實際上一直懶癌發作也沒去看它的文檔,使用著它預設的規則。不過現在是 ...
  • 1、Vue實例常用屬性 (1)數據 data:Vue 實例的數據對象 components:Vue實例配置局部註冊組件 (2)類方法computed:計算屬性 watch:偵聽屬性 filters:過濾器 methods:Vue實例方法 render:渲染函數,創建虛擬DOM (3)生命周期crea ...
  • 1.內聯式引用:直接用在標簽上,但維護成本高 2.外部連接式引用:css代碼與html代碼分離,便於代碼重覆使用 style.css文件內容如右: 3.內部式引用:頁面較為清晰,但不能被別的頁面使用 4.外部導入式:可以在一個HTML文件中導入多個樣式表。類似於外部鏈接式引用 在HTML文件中hea ...
  • "Parcel" 是一個零配置的網路應用打包工具, 適用於經驗不同的開發者, 它利用多核處理提供了極快的速度。對比 webpack 最大的兩個亮點: 零配置 極快速 omi 相關的插件都是基於 webpack 進行開發,今天正式投入 Parcel 懷抱。 準備工作 通過 yarn 或 npm 安裝 ...
  • 分散式事務常常使用2階段提交或者3階段提交,那麼這兩種方式的區別是什麼?3階段提交協議是不是就完美了?圖文解釋,簡單易懂。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...