場景 不知道大家有沒有遇到這樣的情況,就是去自動取款機取錢的時候,比如說你去取1000塊錢,這個時候系統會先幫你把1000塊錢扣除,然後自動取款機再把錢吐出來。但是如果取款機出現問題,會發現錢被扣了,但是錢沒有取出來。我第一次遇到這個問題的時候很擔心,當時跨行取取了3000塊錢,簡訊提醒我錢已經被扣 ...
場景
不知道大家有沒有遇到這樣的情況,就是去自動取款機取錢的時候,比如說你去取1000塊錢,這個時候系統會先幫你把1000塊錢扣除,然後自動取款機再把錢吐出來。但是如果取款機出現問題,會發現錢被扣了,但是錢沒有取出來。我第一次遇到這個問題的時候很擔心,當時跨行取取了3000塊錢,簡訊提醒我錢已經被扣了,但是錢沒取出來,於是準備去找櫃臺幫忙處理的時候,手機上又收到一筆交易提醒,提示錢被退回來了!
在這個事情中,引發了一個對於數據一致性的思考
基於整個資金處理鏈路的體驗,大概的流程是這樣:
場景分析
如果真實的場景是如我這個圖所畫的那樣的話, 會存在幾個問題
1. A銀行同步調用B銀行的遠程介面來扣款,如果介面處理比較耗時或者出現網路故障時,會導致比較阻塞的時間比較長,那麼對於用戶的感覺就是取款機頁面一直在轉圈圈。
2. 當出款失敗的時候,A銀行的本地交易表狀態改成了4出款失敗,並且同步調用B銀行的介面把扣減的3000元回滾。如果回滾失敗,就會導致用戶的錢被扣了,但是沒有取出現金來。
遠程介面的非同步調用
對於第三方的調用,並且對性能有一定要求的流程中,一定不能用同步的方式。所以我們通過非同步化改造一下第一個流程
非同步流程的話,我之前做支付業務的時候,是這麼做的
A銀行調用B銀行的介面,引入了一個非同步消息隊列,把所有的交易指令直接丟給消息隊列非同步去處理。B銀行收到指令執行完以後,再通過
http協議把結果寫回給A銀行
出款失敗的數據回滾
我們先不管方案引入以後會帶來哪些問題,我們先把原來的問題解決掉。
當取款機出款失敗的時候,這筆交易要回滾。按照上面的圖來看,實際上就存在一個數據一致性問題,也就是交易記錄表要記錄這筆交易是失敗的,並且
要把這筆錢退回到賬戶上。這種一致性問題實際上就是大家所說的分散式事務問題
分散式事務問題也叫分散式數據一致性問題
其實在分散式架構中,分散式事務問題,是非常常見的問題。既然是常見,那肯定會有解決辦法。這裡我並不打算展開他的各種解決方案,給大家講講
架構思維層面的東西
首先我們知道資料庫事務會滿足ACID特性:
- 原子性(A);
- 一致性(C);
- 隔離性(I);
- 持久性(D);
而在這四大特性中,一致性是最基本的特性,其它的三個特性都為了保證一致性而存在的!
而在分散式場景中,這種單庫事務就沒什麼意義了。
分散式場景中的事務一致性方案
在分散式架構中,有很多種解決一致性問題的方案,比如TCC(事務補償)、比如基於可靠性消息的最終一致性、比如基於2pc協議的強一致性、
對於很多中間件裡面的一致性協議,有paxos、Raft等演算法 ;這些大家都可以自己去看看
我們前面說過,在分散式架構下,分散式事務的問題是很常見的。所以目前市面上提供的解決方案也比較多。那麼這裡就涉及到兩個概念
一個是強一致性、 一個是弱一致性
所謂的強一致性,就是保證跨節點的數據的強一致,要麼同時成功,要麼同時失敗
而所謂的弱一致性,其實就是一種最終一致性,
CAP和BASE
強一致性和弱一致性有什麼區別,或者對系統會產生什麼樣的影響呢?我們來分析一下
CAP 定理,又被叫作布魯爾定理。對於設計分散式系統(不僅僅是分散式事務)的架構師來說,CAP 就是你的入門理論。
1.C (一致性):對某個指定的客戶端來說,讀操作能返回最新的寫操作。對於數據分佈在不同節點上的數據來說,如果在某個節點更新了數據,那麼在其他節點如果都能讀取到這個最新的數據,那麼就稱為強一致,如果有某個節點沒有讀取到,那就是分散式不一致。
2.A (可用性):非故障的節點在合理的時間內返回合理的響應(不是錯誤和超時的響應)。可用性的兩個關鍵一個是合理的時間,一個是合理的響應。
合理的時間指的是請求不能無限被阻塞,應該在合理的時間給出返回。合理的響應指的是系統應該明確返回結果並且結果是正確的
3.P (分區容錯性):當出現網路分區後,系統能夠繼續工作。打個比方,這裡集群有多台機器,有台機器網路出現了問題,但是這個集群仍然可以正常工作。
熟悉 CAP 的人都知道,三者不能共有,因為在分散式系統中,網路無法 100% 可靠,分區其實是一個必然現象。
如果我們選擇了 CA 而放棄了 P,那麼當發生分區現象時,為了保證一致性,這個時候必須拒絕請求,但是 A 又不允許,所以分散式系統理論上不可能選擇 CA 架構,只能選擇 CP 或者 AP 架構。
對於 CP 來說,放棄可用性,追求一致性和分區容錯性。
對於 AP 來說,放棄一致性(這裡說的一致性是強一致性),追求分區容錯性和可用性,這是很多分散式系統設計時的選擇,後面的 BASE 也是根據 AP 來擴展。
BASE 是 Basically Available(基本可用)、Soft state(軟狀態)和 Eventually consistent (最終一致性)三個短語的縮寫,是對 CAP 中 AP 的一個擴展。
基本可用:分散式系統在出現故障時,允許損失部分可用功能,保證核心功能可用。
軟狀態:允許系統中存在中間狀態,這個狀態不影響系統可用性,這裡指的是 CAP 中的不一致。
最終一致:最終一致是指經過一段時間後,所有節點數據都將會達到一致。
BASE 解決了 CAP 中理論沒有網路延遲,在 BASE 中用軟狀態和最終一致,保證了延遲後的一致性。
對於互聯網公司,用戶體驗是最重要的,所以為了避免強一致帶來的阻塞,會採用最終一致性方案來解決數據一致性問題。而用得比較多的都是基於本地消息表+非同步隊列 以及基於可靠性消息隊列來實現最終一致性方案
出款失敗場景改造
基於理論的鋪墊,我們可以思考並改造一下取款的邏輯
這個環節到這裡就結束了嗎?其實還沒有
僅僅利用可靠性消息隊列來保證數據的最終一致性還是不夠的,如果消息隊列本身的可靠性出現問題也會帶來數據不一致問題。
所以一般的做法是,在A銀行端做一個本地消息表,記錄這筆消息的處理狀態。然後通過定時任務來輪詢消息表,來實現數據最終一致性
消息表設計
消息表中有交易必須要用到的業務欄位,也有設計到消息重發的輔助欄位
Id 交易流水號
status 交易狀態
lastUpdateTime 最後更新時間
如果覺得本文有用,推薦頂一頂,可以讓更多的人能夠看到!
歡迎關註公眾號:“Java架構師學習”
你會喜歡的!