消息無序產生的原因 消息隊列,既然是隊列就能保證消息在進入隊列,以及出隊列的時候保證消息的有序性,顯然這是在消息的生產端(Producer),但是往往在生產環境中有多個消息的消費端(Consumer),儘管消費端在拉取消息時是有序的,但各個消息由於網路等方面原因無法保證在各個消費端中處理時有序。 場 ...
消息無序產生的原因
消息隊列,既然是隊列就能保證消息在進入隊列,以及出隊列的時候保證消息的有序性,顯然這是在消息的生產端(Producer),但是往往在生產環境中有多個消息的消費端(Consumer),儘管消費端在拉取消息時是有序的,但各個消息由於網路等方面原因無法保證在各個消費端中處理時有序。
場景分析
先後兩次修改了商品信息,消息A和消息B先後同步寫入MySQL,接著非同步寫入消息隊列中發送消息,此時消息隊列生產端(Producer)按時序先後發出了A和B兩條消息(消息A先發出,消息B後發出)。按業務邏輯,商品信息的最終狀態需要以消息A和消息B綜合為準。
看似一個比較常見的同步寫資料庫,非同步發送消息的場景,但實際上需要保證消息的有序消費。
- 假設1:消息A只包含修改的商品名稱,消息B只包含修改的商品重量,此時消息隊列的消費端實際上不需要關註消息時序,消息隊列消費端(Consumer)只管消費即可。
- 假設2:消息A包含修改的商品名稱、重量,消息B包含修改的商品名稱,此時消費端首先接收到消息B,後接收到消息A,那麼消息B的修改就會被覆蓋。此時消息隊列的消費端實際上又需要關註消息時序。
可見,你無法保證消息中包含什麼信息,此時必須保證消息的有序消費。
業務角度如何保證消息有序消費
- 生產端在發送消息時,始終保證消息是全量信息。
- 消費端在接收消息時,通過緩存時間戳的方式,消費消息時判斷消息產生的時間是否最新,如果不是則丟棄,如果是則執行下一步。
下麵通過偽代碼的方式描述:
生產端偽代碼
insertWare(ware); #插入數據到資料庫,通常在插入資料庫時我們只會update修改的欄位,而不會全量插入
ware = selectWareById(ware.getId); #獲取商品的全量信息(此時是最新的),用於將它放入到消息隊列中
syncMq(ware); #非同步發送mq消息A
消費端偽代碼
ware = fetchWare(); #獲取消息
if (isLasted(ware)) #通過商品的修改時間戳判斷是否是最新的修改
TODO #執行下一步業務邏輯
else
return #丟棄該消息
重點在於消費端如何判斷該消息是否是最新的修改也就是isLasted
方法。
isLasted方法
Long modified = getCacheById(ware.getId); #獲取緩存中該條商品的最新修改時間
If (ware.getModified > modified) { #如果消息中商品修改時間大於緩存中的時間,說明是最新操作
setCacheById(ware); #將該條消息的商品修改時間戳寫入到緩存中
return true;
} else #如果消息中的商品修改時間小於緩存中的時間,說明該條消息屬於“歷史操作”,不對其更新 return false;
以上就是通過偽代碼的方式,描述如何通過業務手段保證消息有序消費,重點在於全量發送信息和緩存時間戳。在其中還有一些技術實現細節。
例如:消費端消費消息B,執行到獲取時間戳緩存之後,併在重新設置新的緩存之前,此時另一個消費端恰好也正在消費B它也正執行到獲取時間戳緩存,由於消息A此時並沒有更新緩存,消息A拿到的緩存仍然是舊的緩存,這時就會存在兩個消費端都認為自己所消費的消息時最新的,造成該丟棄的消息沒丟。
顯然,這是分散式線程安全問題,分散式鎖通常使用Redis或者ZooKeeper,加鎖後的執行時序如下圖所示。
這是從業務角度保證消息在消費端有序消費。通過在消息發送端全量發送消息以及在消息消費端緩存時間戳就可以保證消息的有序消費。
在上述場景中是先同步寫入MySQL,再獲取商品全量數據,接著再非同步發送消息。這一系列的步驟可以通過接MySQL的binlog實現,在同步寫入MySQL後,MySQL發送binlog變更,通過阿裡巴巴Canal中間件接收MySQL的binlog變更再發送消息到消息隊列。
這是一個能給程式員加buff的公眾號 (CoderBuff)