從儲值卡(會員卡)充值業務看分散式事務的設計

来源:https://www.cnblogs.com/linvanda/archive/2020/04/20/12651725.html
-Advertisement-
Play Games

公司有一項儲值卡充值業務:客戶在微信公眾號開通儲值卡服務,通過微信支付往卡裡面充值,充值成功後客戶可收到消息通知,併進行消費。 看起來是一項很簡單的業務,最初我們儲值卡團隊的實現也確實很簡單。我們看看最初的實現: 相信聰明的你一眼就能看出問題: 1. 壓根沒有考慮分散式事務一致性,比如第 12 步根 ...


公司有一項儲值卡充值業務:客戶在微信公眾號開通儲值卡服務,通過微信支付往卡裡面充值,充值成功後客戶可收到消息通知,併進行消費。

看起來是一項很簡單的業務,最初我們儲值卡團隊的實現也確實很簡單。我們看看最初的實現:
儲值卡充值最初版本實現

相信聰明的你一眼就能看出問題:

  1. 壓根沒有考慮分散式事務一致性,比如第 12 步根本沒有考慮卡系統充值失敗的情況該如何處理,而是預設其一定能成功;
  2. 大部分的處理都是放在前端業務系統(除了這裡的公眾號系統,還有 POS 機系統,而 POS 機是通過調公眾號系統介面來實現的);
  3. 第 4 步直接下單,第 5 步直接調微信支付,壓根沒有跟卡系統有任何通信:這裡預設用戶的充值行為一定是合法的;
  4. 在微信的支付回調中(第 10 步往後),是先處理一系列業務邏輯,最後才調充值介面,這裡也是預設卡充值一定能成功;

看到這裡你可能會大呼開發人員是不是沒長腦子?

實際情況是,這個版本的開發是幾年前的事情了,那時候公司還是創業早期,第一目標是儘快上線能用,而且客戶量沒有那麼大,雖然中間也出現過一些數據不一致的情況,也都通過人工處理了事了。

隨著公司業務的發展,用戶量越來越大,而且還要和第三方合作(儲值卡作為一種支付方式提供給第三方使用),問題出現得也越來越頻繁,不得不將這塊提上重構議程。

那麼,針對上面提的幾點問題,我們大體能想到如下重構項:

  1. 將充值業務邏輯從前端系統剝離,做成單獨的服務;
  2. 在下單前,先調一下卡系統介面,檢查用戶的充值行為是否合法,避免後面不必要的麻煩;
  3. 在支付回調中,處理充值失敗的場景;

初步設計如下:
儲值卡充值:第一版重構設計

這裡我們重點討論下對第 14 步(卡充值介面返回結果)的處理:

  1. 如果返回充值成功,那萬事大吉,該幹嘛幹嘛;
  2. 如果失敗呢?可能的處理方式如下:
    1. 繼續重試,最多重試 3 次,如果成功了,萬事大吉;
    2. 如果上面重試還是失敗,那麼調微信退款,並將訂單狀態改成充值失敗;

騷年你等等!
你說什麼?重試失敗了就去退款?

實踐中,遠程調用失敗的一個很大原因是網路超時(而超時的很大原因又是對方負載過高),而面對超時,我們是不知道對方到底有沒有處理成功的,萬一這邊把錢退掉了,那邊又充值成功咋辦?(我們是 SaaS 服務商,這時真正的損失方是我們的商戶,而商戶無疑會找我們索賠的)
立即退款會帶來問題

一種方案是:
在多次重試失敗後發起微信退款之前,先調卡系統查詢介面,如果查詢結果是充值成功,則不退款,繼續後續流程,否則發起退款;

該方案在實際中也基本行不通,因為如果那段時間網路有問題或者對方伺服器負載高,查詢也有很大概率失敗,或者就算查成功了並返回充值記錄不存在,也有可能之前調的充值介面還在跑(比如處於鎖等待狀態)。

有人可能會說,沒關係啊,就算退款後充值成功了,那後面通過人工或者系統發現數據問題再處理掉不就行了嗎?

問題在於,如果在發現問題之前,用戶已經從卡上消費掉了呢(比如用戶當場沖1000 然後立馬消費掉,這在我們實際場景中是經常發生的,因為很多商戶會搞充值活動,比如沖1000 送 200)?把卡餘額扣成負數?(這不是我杜撰的,在我們老儲值卡系統就出現過幾次這種情況,當時是直接由公司給商戶賠錢)

因此,關鍵在於,當充值中心不知道卡系統有無充值成功的情況下,需要內部假定充值成功了。

最終,我們決定用定時任務來解決。在微信支付回調中,如果多次調卡充值介面失敗,我們不發起退款,也不進行後續流程,而是在資料庫中寫入一條異常記錄,然後結束本次處理。

在定時任務中(比如 10 分鐘一次),我們取出那些異常記錄,調卡系統相關介面核對最終狀態,如果充值成功了,則補充執行充值成功的後續流程,否則發起微信退款,並執行其他充值失敗流程(如改訂單狀態,給用戶發通知、回調業務系統等)。

為了防止錢退了後卡又充值成功,定時任務中只處理 1 小時前的數據。

另一個隱藏的問題是,在前面的充值流程中,直到微信支付回調,卡系統都沒有關於這次充值行為的任何記錄。這可能會導致後續一系列問題,其中一個問題是,在最初下單(步驟 5)到最終充值(步驟 13)這段時間內,一旦任何變數(充值規則)發生改變,這次充值就有可能會失敗(或者導致數據差錯)。這個時間差短則幾十毫秒,長則幾分鐘十幾分鐘都有可能。另一個次要問題是,一旦發生充值異常,卡系統自身是不知情的(因為沒有任何記錄),對卡系統的任何查詢也都不會反映這次充值行為。

為瞭解決該問題,我們引入預充值的概念。在下單後調微信支付前,先同步調卡系統的預充值介面,該介面計算充值合法性並生成一條預充值記錄,該記錄包含充值賬號、充值金額、支付金額、充值單號等關鍵信息,狀態為“充值中”。

在微信支付回調中,將預充值狀態改成“充值成功”,並處理一些其他邏輯。
綜合,最終方案如圖:
最終版本

總結:

  1. 任何涉及到分散式事務的地方都是複雜的,必須小心設計;
  2. 遠程過程處理不具有時序性,設計時必須考慮進去(如退款後最終又充值成功的情況);
  3. 現實中的設計很多時候做不到完美,我們要做的是保證出現異常的概率最小化並設置最終檢查哨兵(上面的定時任務);
  4. 就算增設了哨兵,也不排除需要人工干預的可能性,因而在設計上儘量保證需要人工干預時有跡可循、方便處理;
  5. 遠程調用需要有重試機制(上面只說了對充值介面的重試,其實其他介面也一樣需要有重試機制);
  6. 記住一句話:網路總是不可靠的;

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 弄了兩天左右,把這個經典案例做出來了。 下麵是成品圖: html代碼: <!DOCTYPE html> <html> <head> <meta charset="utf-8" /> <title>雲道官網</title> <link rel="stylesheet" href="css/style. ...
  • 結合html2canvas和jsPDF實現html頁面轉pdf By:授客 QQ:103355122 實踐環境 win10 Vue 2.9.6 axios 0.18.0 html2canvas 1.0.0-rc.3 jspdf 1.5.3 安裝 html2canvas 進入vue項目所在目錄,然後執 ...
  • 1、如果之前有全局安裝過vue-2,先卸載掉 cnpm uni -g vue-cli 2、安裝vue-cli3 cnpm install -g @vue/cli 3、可以使用vue ui 進入圖形界面創建項目 4、也可以使用命令行進行創建 ...
  • 寫在前面 上一講「Vuex 旗下的 State 和 Getter」,告訴了我們怎麼去使用倉庫 store 中的狀態數據。當然,光會用肯定還不夠,大部分的應用場景還得對這些狀態進行操控,那麼具體如何操控呢,這就是這一講要說的重點。 只有 mutation 能動 State 更改 Vuex 的 stor ...
  • 頁面應用需要Vuex管理全局/模塊的狀態,大型單頁面組件如果靠事件(events)/屬性(props)通訊傳值會把各個組件耦合在一起。因此需要Vuex管理屬性之間都狀態 ...
  • echarts實現堆疊圖,可自定義MakeLine文字。 顯示效果: 1 var seriesName = ['直接訪問', '郵件營銷', '聯盟廣告', '視頻廣告', '搜索引擎']; 2 var labels = ['周一', '周二', '周三', '周四', '周五', '周六', '周 ...
  • 一、將漢字轉換為Unicode 1 /* 2 *將漢字轉換為Unicode 3 *charCodeAt返回字元串指定位置的字元的Unicode編碼(十進位形式),在0-65535之間。 4 * 5 *toString(16) 將一個數字轉成十六進位。 6 */ 7 function toUnicod ...
  • class bldy(): def one (self): a = 5 return a # return 返回到self def two(self): b = 10 return b def sum(self, a, b): # 你給我兩個參數,我就執行下麵的方法 c = a + b return ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...