國際財務系統基於ShardingSphere的數據分片和一主多從實踐

来源:https://www.cnblogs.com/Jcloud/archive/2023/02/16/17125943.html
-Advertisement-
Play Games

作者:京東物流 張廣治 1 背景 傳統的將數據集中存儲至單一數據節點的解決方案,在性能和可用性方面已經難於滿足海量數據的場景,系統最大的瓶頸在於單個節點讀寫性能,許多的資源受到單機的限制,例如連接數、網路IO、磁碟IO等,從而導致它的併發能力不高,對於高併發的要求不滿足。 每到月初國際財務系統壓力巨 ...


作者:京東物流 張廣治

1 背景

傳統的將數據集中存儲至單一數據節點的解決方案,在性能和可用性方面已經難於滿足海量數據的場景,系統最大的瓶頸在於單個節點讀寫性能,許多的資源受到單機的限制,例如連接數、網路IO、磁碟IO等,從而導致它的併發能力不高,對於高併發的要求不滿足。

每到月初國際財務系統壓力巨大,因為月初有大量補全任務,重算、計算任務、賬單生成任務、推送集成等都要趕在月初1號完成,顯然我們需要一個支持高性能、高併發的方案來解決我們的問題。

2 我們的目標

  1. 支持每月接單量一億以上。
  2. 一億的單量補全,計算,生成賬單在24小時內完成(支持前面說的月初大數據量計算的場景)

3 數據分配規則

現實世界中,每一個資源都有其提供服務能力的上限,當某一個資源達到最大上限後就無法及時處理溢出的需求,這樣就需要使用多個資源同時提供服務來滿足大量的任務。當使用了多個資源來提供服務時,最為關鍵的是如何讓每一個資源比較均勻的承擔壓力,而不至於其中的某些資源壓力過大,所以分配規則就變得非常重要。

制定分配規則:要根據查詢和存儲的場景,一般按照類型、時間、城市、區域等作為分片鍵。

財務系統的租戶以業務線為單位,缺點為拆分的粒度太大,不能實現打散數據的目的,所以不適合做為分片鍵,事件定義作為分片鍵,缺點是非常不均勻,目前2C進口清關,一個事件,每月有一千多萬數據,鯤鵬的事件,每月單量很少,如果按照事件定義拆分,會導致數據極度傾斜。

目前最適合作為分片鍵的就是時間,因為系統中計算,賬單,彙總,都是基於時間的,所以時間非常適合做分片鍵,適合使用月、周、作為Range的周期。目前使用的就是時間分區,但只按照時間分區顯然已經不能滿足我們的需求了。

經過篩選,理論上最適合的分區鍵就剩下時間收付款對象了。

最終我們決定使用收付款對象分庫,時間作為表分區。

數據拆分前結構(圖一):

數據水平拆分後結構(圖二):

分配規則

(payer.toUpperCase()+"_"+payee.toUpperCase()).hashCode().abs()%128

收款對象大寫加分隔符加付款對象大寫,取HASH值的絕對值模分庫數量

重要:payer和payee字母統一大寫,因為大小寫不統一,會導致HASH值不一致,最終導致路由到不同的庫。

4 讀寫分離一主多從

4.1ShardingSphere對讀寫分離的解釋

對於同一時刻有大量併發讀操作和較少寫操作類型的數據來說,將資料庫拆分為主庫和從庫,主庫負責處理事務性的增刪改操作,從庫負責處理查詢操作,能夠有效的避免由數據更新導致的行鎖,使得整個系統的查詢性能得到極大的改善。

通過一主多從的配置方式,可以將查詢請求均勻的分散到多個數據副本,能夠進一步的提升系統的處理能力。 使用多主多從的方式,不但能夠提升系統的吞吐量,還能夠提升系統的可用性,可以達到在任何一個資料庫宕機,甚至磁碟物理損壞的情況下仍然不影響系統的正常運行。

把數據量大的大表進行數據分片,其餘大量併發讀操作且寫入小的數據進行讀寫分離,如(圖三)

左側為主從結構,右側為數據分片

4.2 讀寫分離+數據分片實戰

當我們實際使用sharding進行讀寫分離+數據分片時遇到了一個很大的問題,官網文檔中的實現方式只適合分庫和從庫在一起時的場景如(圖四)

而我們的場景為(圖三)所示,從庫和分庫時徹底分開的,參考官網的實現方法如下:

https://shardingsphere.apache.org/document/4.1.1/cn/manual/sharding-jdbc/configuration/config-spring-boot/#數據分片--讀寫分離

官網給出的讀寫分離+數據分片方案不能配置
spring.shardingsphere.sharding.default-data-source-name預設數據源,如果配置了,所有讀操作將全部指向主庫,無法達到讀寫分離的目的。

當我們困擾在讀從庫的查詢會被輪詢到分庫中,我們實際的場景從庫和分庫是分離的,分庫中根本就不存在從庫中的表。此問題困擾了我近兩天的時間,我閱讀源碼發現
spring.shardingsphere.sharding.default-data-source-name可以被賦值一個DataNodeGroup,不僅僅支持配置datasourceName,sharding源碼如下圖:

由此
spring.shardingsphere.sharding.default-data-source-name配置為讀寫分離的groupname1,問題解決

從庫和分庫不在一起的場景下,讀寫分離+數據分配的配置如下:

#數據源名稱
spring.shardingsphere.datasource.names= defaultmaster,ds0,ds1,ds2,ds3,ds4,ds5,ds6,ds7,ds8,ds9,ds10,ds11,ds12,ds13,ds14,ds15,ds16,ds17,ds18,ds19,ds20,ds21,ds22,ds23,ds24,ds25,ds26,ds27,ds28,ds29,ds30,ds31,slave0,slave1
#未配置分片規則的表將通過預設數據源定位,註意值必須配置為讀寫分離的分組名稱groupname1
spring.shardingsphere.sharding.default-data-source-name=groupname1
#主庫
spring.shardingsphere.datasource.defaultmaster.jdbc-url=jdbc:mysql:
spring.shardingsphere.datasource.defaultmaster.type= com.zaxxer.hikari.HikariDataSource
spring.shardingsphere.datasource.defaultmaster.driver-class-name= com.mysql.jdbc.Driver
#分庫ds0
spring.shardingsphere.datasource.ds0.jdbc-url=jdbc:mysql:
spring.shardingsphere.datasource.ds0.type= com.zaxxer.hikari.HikariDataSource
spring.shardingsphere.datasource.ds0.driver-class-name= com.mysql.jdbc.Driver
#從庫slave0
spring.shardingsphere.datasource.slave0.jdbc-url=jdbc:mysql:
spring.shardingsphere.datasource.slave0.type= com.zaxxer.hikari.HikariDataSource
spring.shardingsphere.datasource.slave0.driver-class-name= com.mysql.jdbc.Driver
#從庫slave1
spring.shardingsphere.datasource.slave1.jdbc-url=jdbc:mysql:
spring.shardingsphere.datasource.slave1.type= com.zaxxer.hikari.HikariDataSource
spring.shardingsphere.datasource.slave1.driver-class-name= com.mysql.jdbc.Driver


#由數據源名 + 表名組成,以小數點分隔。多個表以逗號分隔,支持inline表達式。預設表示使用已知數據源與邏輯表名稱生成數據節點,用於廣播表(即每個庫中都需要一個同樣的表用於關聯查詢,多為字典表)或只分庫不分表且所有庫的表結構完全一致的情況
spring.shardingsphere.sharding.tables.incident_ar.actual-data-nodes=ds$->{0..127}.incident_ar
#行表達式分片策略 分庫策略,預設表示使用預設分庫策略
spring.shardingsphere.sharding.tables.incident_ar.database-strategy.inline.sharding-column= dept_no
#分片演算法行表達式,需符合groovy語法
spring.shardingsphere.sharding.tables.incident_ar.database-strategy.inline.algorithm-expression=ds$->{dept_no.toUpperCase().hashCode().abs() % 128}
#讀寫分離配置
spring.shardingsphere.sharding.master-slave-rules.groupname1.master-data-source-name=defaultmaster
spring.shardingsphere.sharding.master-slave-rules.groupname1.slave-data-source-names[0]=slave0
spring.shardingsphere.sharding.master-slave-rules.groupname1.slave-data-source-names[1]=slave1
spring.shardingsphere.sharding.master-slave-rules.groupname1.load-balance-algorithm-type=round_robin

可以看到讀操作可以被均勻的路由到slave0、slave1中,分片的讀會被分配到ds0,ds1中如下圖:

4.3 實現自己的讀寫分離負載均衡演算法

Sharding提供了SPI形式的介面
org.apache.shardingsphere.spi.masterslave.MasterSlaveLoadBalanceAlgorithm實現讀寫分離多個從的具體負載均衡規則,代碼如下:

import lombok.Getter;
import lombok.RequiredArgsConstructor;
import lombok.Setter;
import org.apache.shardingsphere.spi.masterslave.MasterSlaveLoadBalanceAlgorithm;
import org.springframework.stereotype.Component;
import java.util.List;
import java.util.Properties;


@Component
@Getter
@Setter
@RequiredArgsConstructor
public final class LoadAlgorithm implements MasterSlaveLoadBalanceAlgorithm {


    private Properties properties = new Properties();


    @Override
    public String getType() {return "loadBalance";}


    @Override
    public String getDataSource(final String name, final String masterDataSourceName, final List<String> slaveDataSourceNames) {
        //自己的負載均衡規則
        return slaveDataSourceNames.get(0);
    

RoundRobinMasterSlaveLoadBalanceAlgorithm 實現為所有從輪詢負載
RandomMasterSlaveLoadBalanceAlgorithm 實現為所有從隨機負載均衡

4.4 關於某些場景下必須讀主庫的解決方案

某些場景比如分散式場景下寫入馬上讀取的場景,可以使用hint方式進行強制讀取主庫,Sharding源碼使用ThreadLocal實現強制路由標記。

下麵封裝了一個註解可以直接使用,代碼如下:

@Documented
@Target({ElementType.METHOD})
@Retention(RetentionPolicy.RUNTIME)
public @interface SeekMaster {
}


import lombok.extern.slf4j.Slf4j;
import org.apache.shardingsphere.api.hint.HintManager;
import org.aspectj.lang.ProceedingJoinPoint;
import org.aspectj.lang.annotation.Around;
import org.aspectj.lang.annotation.Aspect;
import org.springframework.stereotype.Component;
/**
 * ShardingSphere >讀寫分離自定義註解>用於實現讀寫分離時>需要強制讀主庫的場景(註解實現類)
 *
 * @author zhangguangzhi1
 **/
@Slf4j
@Aspect
@Component
public class SeekMasterAnnotation {
    
    @Around("@annotation(seekMaster)")
    public Object doInterceptor(ProceedingJoinPoint joinPoint, SeekMaster seekMaster) throws Throwable {


        Object object = null;
        Throwable t = null;
        try {
            HintManager.getInstance().setMasterRouteOnly();
            log.info("強制查詢主庫");


            object = joinPoint.proceed();


        } catch (Throwable throwable) {
            t = throwable;
        } finally {


            HintManager.clear();


            if (t != null) {
                throw t;
            }
        }
        return object;
  

使用時方法上打SeekMaster註解即可,方法下的所有讀操作將自動路由到主庫中,方法外的所有查詢還是讀取從庫,如下圖:

4.5 關於官網對讀寫分離描述不夠明確的補充說明

版本4.1.1

經實踐補充說明為:

同一線程且同一資料庫連接且一個事務中,如有寫入操作,以後的讀操作均從主庫讀取,只限存在寫入的表,沒有寫入的表,事務中的查詢會繼續路由至從庫中,用於保證數據一致性。

5 關於分庫的JOIN操作

方法1

使用default-data-source-name配置預設庫,即沒有配置數據分片策略的表都會使用預設庫。預設庫中表禁止與拆分表進行JOIN操作,此處需要做一些改造,目前系統有一些JOIN操作。(推薦使用此方法)

方法2

使用全局表,廣播表,讓128個庫中冗餘基礎庫中的表,並實時改變。

方法3

分庫表中冗餘需要JOIN表中的欄位,可以解決JOIN問題,此方案單個表欄位會增加。

6 分散式事務

6.1 XA事務管理器參數配置

XA是由X/Open組織提出的分散式事務的規範。 XA規範主要定義了(全局)事務管理器(TM)和(局 部)資源管理器(RM)之間的介面。主流的關係型 資料庫產品都是實現了XA介面的。

分段提交

XA需要兩階段提交: prepare 和 commit.

第一階段為 準備(prepare)階段。即所有的參與者準備執行事務並鎖住需要的資源。參與者ready時,向transaction manager報告已準備就緒。

第二階段為提交階段(commit)。當transaction manager確認所有參與者都ready後,向所有參與者發送commit命令。

ShardingSphere預設的XA事務管理器為Atomikos,在項目的logs目錄中會生成xa_tx.log, 這是XA崩潰恢復時所需的日誌,請勿刪除。

6.2 BASE柔性事務管理器(SEATA-AT配置)

Seata是一款開源的分散式事務解決方案,提供簡單易用的分散式事務服務。隨著業務的快速發展,應用單體架構暴露出代碼可維護性差,容錯率低,測試難度大,敏捷交付能力差等諸多問題,微服務應運而生。微服務的誕生一方面解決了上述問題,但是另一方面卻引入新的問題,其中主要問題之一就是如何保證微服務間的業務數據一致性。Seata 註冊配置服務中心均使用 Nacos。Seata 0.2.1+ 開始支持 Nacos 註冊配置服務中心。

  1. 按照seata-work-shop中的步驟,下載並啟動seata server。
  2. 在每一個分片資料庫實例中執創建undo_log表(以MySQL為例)
CREATE TABLE IF NOT EXISTS `undo_log`
(
  `id`            BIGINT(20)   NOT NULL AUTO_INCREMENT COMMENT 'increment id',
  `branch_id`     BIGINT(20)   NOT NULL COMMENT 'branch transaction id',
  `xid`           VARCHAR(100) NOT NULL COMMENT 'global transaction id',
  `context`       VARCHAR(128) NOT NULL COMMENT 'undo_log context,such as serialization',
  `rollback_info` LONGBLOB     NOT NULL COMMENT 'rollback info',
  `log_status`    INT(11)      NOT NULL COMMENT '0:normal status,1:defense status',
  `log_created`   DATETIME     NOT NULL COMMENT 'create datetime',
  `log_modified`  DATETIME     NOT NULL COMMENT 'modify datetime',
  PRIMARY KEY (`id`),
  UNIQUE KEY `ux_undo_log` (`xid`, `branch_id`)
) ENGINE = InnoDB
  AUTO_INCREMENT = 1
  DEFAULT CHARSET = utf8 COMMENT ='AT transaction mode undo table';

3.在classpath中增加seata.conf

client {
    application.id = example    ## 應用唯一id
    transaction.service.group = my_test_tx_group   ## 所屬事務組
}

6.3 Sharding-Jdbc預設提供弱XA事務

官方說明:

完全支持非跨庫事務,例如:僅分表,或分庫但是路由的結果在單庫中。

完全支持因邏輯異常導致的跨庫事務。例如:同一事務中,跨兩個庫更新。更新完畢後,拋出空指針,則兩個庫的內容都能回滾。

不支持因網路、硬體異常導致的跨庫事務。例如:同一事務中,跨兩個庫更新,更新完畢後、未提交之前,第一個庫死機,則只有第二個庫數據提交。

6.4 分散式事務場景

1.保存場景

推薦使用第三種弱XA事務,儘量設計時避免跨庫事務,目前設計為事件和事件數據為同庫(分庫時,將一個線索號的事件和事件數據HASH進入同一個分庫),儘量避免跨庫事務。

事件和計費結果本身設計為非同步,非同一事務,所以事件和對應的結果不涉及跨庫事務。

保存多個計費結果,每次保存都屬於一個事件,一個事件的計費結果都屬於一個收付款對象,天然同庫。

弱XA事務的性能最佳。

2.更新場景

對一些根據ID IN的更新場景,根據收付款對象分組執行,可以避免在所有分庫執行更新。

3.刪除場景

無,目前都是邏輯刪除,實際為更新。

7 總結

1.推薦使用Sharding-Sphere進行分庫,分表可以考慮使用MYSQL分區表,對於研發來講完全是透明的,可以規避JOIN\分散式事務等問題。(分區表需要為分區鍵+ID建立了一個聯合索引)MYSQL分區得到了大量的實踐印證,沒有BUG,包括我在新計費初期,一直堅持推動使用的分表方案,不會引起一些難以發現的問題,在同庫同磁碟下性能與分表相當。

2.對於同一時刻有大量併發讀操作和較少寫操作類型的數據來說,適合使用讀寫分離,增加多個讀庫,緩解主庫壓力,要註意的是必須讀主庫的場景使用SeekMaster註解來實現。

3.數據分庫選擇合適的分片鍵非常重要,要根據業務需求選擇好分庫鍵,儘力避免數據傾斜,數據不均勻是目前數據拆分的一個共同問題,不可能實現數據的完全均勻;當查詢條件沒有分庫鍵時會遍歷所有分庫,查詢儘量帶上分庫鍵。

4.在我們使用中間件時,不要只看官網解釋,要多做測試,用實際來驗證,有的時候官網解釋話術可能存在歧義或表達不夠全面的地方,分析源碼和實際測試可以清晰的獲得想要的結果。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • MQ,中文是消息隊列(MessageQueue),字面來看就是存放消息的隊列。也就是事件驅動架構中的Broker。 快速入門 1.publisher實現 public class PublisherTest { @Test public void testSendMessage() throws I ...
  • 一、安裝PHP 下載:https://windows.php.net/download 我下載的是此時的最新版8.2.3 下載後 解壓目錄 放到C:/tool下麵目錄重命名為PHP 目錄自己定 我這個tool目錄是個人習慣 你可以放到主流的C:\Program Files下也可以放到D盤E盤任何地方 ...
  • 一、部署gitlab 這裡使用的是Centos8,安裝Docker環境 ,這裡不說了,參考:https://www.cnblogs.com/wei325/p/15139701.html gitlab有ce版和ee版,ce版為免費版本;ee版為企業版本,需要收費;企業使用ce版足夠了,這裡用ce版。 ...
  • 概述 工廠方法模式(FactoryMethod),定義一個創建產品對象的工廠介面,讓工廠子類決定實例化那一個產品類。我們把被創建的對象稱為“產品”,把創建產品的對象稱為“工廠”。如果要創建的產品不多,只要一個工廠類就可以完成,這種模式叫“簡單工廠模式”,它不屬於 23 種經典設計模式,它的缺點是增加 ...
  • 常用命令 ip addr 查看ip地址 pwd 顯示當前所有路徑 top 查看進程的cpu、記憶體占用情況 ps -ef | grep -i 進程名字 查看進程運行信息 kill -9 進程pid 強制殺死進程 history 查看歷史命令 !歷史命令編號 執行該歷史命令 shutdown 關機 re ...
  • 打算整理彙編語言與介面微機這方面的學習記錄。本部分介紹彙編語言程式設計以及一些跟程式設計密切相關的指令類。 參考資料 西電《微機原理與系統設計》周佳社 西交《微機原理與介面技術》 課本《彙編語言與介面技術》王讓定 小甲魚《彙編語言》 1. 彙編程式結構/框架 段定義偽指令 程式不同的信息要定義在不同 ...
  • 摘要:雲原生資料庫逐漸成為資料庫行業的“新寵”,未來會有越來越多企業選擇雲原生化,雲原生資料庫將成為企業數字化轉型的重要選擇。 資料庫作為企業數字化轉型的基石,與雲計算相結合打造了雲原生資料庫,雲原生資料庫利用雲平臺的優勢,更能滿足企業對資源彈性調度、按需使用、擴展性、性能降本增效以及各種複雜場景的 ...
  • 一:背景 1. 講故事 今天和大家聊一套面試中經常被問到的高頻題,對,就是 臨時表 和 表變數 這倆玩意,如果有朋友在面試中回答的不好,可以嘗試看下這篇能不能幫你成功邁過。 二:到底有什麼區別 1. 前置思考 不管是 臨時表 還是 表變數 都帶了 表 這個詞,既然提到了 表 ,按推理自然會落到某一個 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...