本文將對幾種緩存與資料庫保證數據一致性的使用方式進行分析。為保證高併發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ...
作者:京東零售 於瀧
一、背景
在高併發場景中,為防止大量請求直接訪問資料庫,緩解資料庫壓力,常用的方式一般會增加緩存層起到緩衝作用,減少資料庫壓力。引入緩存,就會涉及到緩存與資料庫中數據如何保持一致性問題,本文將對幾種緩存與資料庫保證數據一致性的使用方式進行分析。為保證高併發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。
二、讀取過程
• 讀緩存
• 如果緩存里沒有值,那就讀取資料庫的值
• 同時把這個值寫進緩存中
三、更新過程
更新操作有多種策略,各有優劣,主要針對此場景進行分析
策略1:先更新db,再刪除緩存(常用的Cache-Aside Pattern旁路緩存)
問題:
1.如果更新db成功,刪緩存失敗,將導致數據不一致
2.極端場景,請求A讀,B寫
1)此時緩存剛好失效 2)A查庫得到舊值 3)B更新DB成功
4)B刪除緩存 5)A將查到的舊值更新到緩存中
此場景的發生需要步驟2)查db 始終慢於 3)的更新db,才能導致4)先於5)執行,通常db的查詢是要快於寫入的,所以此極端場景的產生過於嚴格,不易發生
策略2:先更新db,再更新緩存
問題:
1.併發更新場景下,更新緩存會導致數據不一致
2.根據讀寫比,考慮是否有必要頻繁同步更新緩存,而且,如果構造緩存中數據過於複雜,或者數據更新頻繁,但是讀取並不頻繁的情況,還會造成不必要的性能損耗
此種方式不推薦
策略3:先更新緩存,再更新db
同上,不推薦
策略4:先刪緩存,再更新db
先刪緩存,雖然解決了策略1中,後刪緩存如果失敗的場景,但也會發生不一致的問題
例如:請求 A 刪除緩存,這時請求B來查,就會擊穿到資料庫,B讀取到舊的值後寫入緩存,A正常更新db,由於時間差導致數據不一致的情況
策略5:緩存延時雙刪
該策略相容了策略1和策略4,解決了先刪緩存還是後刪緩存的問題,如策略1中,更新db後刪緩存失敗和策略4中的不一致場景,該策略可以將延時時間內(比如延時10ms)所造成的緩存臟數據,再次刪除。但是,如果延時刪緩存失敗,策略4中不一致問題還會發生,同時延時的實現,如創建線程,或者引入mq非同步,可能會增加系統複雜度問題。
策略6:變種雙刪,前置緩存過期時間
該策略針對策略1中後刪緩存失敗的場景,前置一層緩存數據過期時間(具體時間根據自身系統本身評估,如可覆蓋db讀寫耗時或一致性容忍度等),更新db後就算刪緩存失敗,在expire時間後也能保證緩存中無數據。同時,前置expire失敗,或者更新db失敗,都不會影響數據一致。
能夠解決策略4中的問題:請求 A 刪除緩存,這時請求B來查,就會擊穿到資料庫,B讀取到舊的值後寫入緩存,A正常更新db,由於時間差導致數據不一致的情況,描述圖如下:
本策略中步驟1為expire緩存,不會發生擊穿緩存到資料庫的情況,數據將直接返回。除非更極端情況,如下圖:
expire時間沒有覆蓋住更新db的耗時,類似策略1中極端場景,此處不贅述
四、總結
對於每種方案策略,各有利弊,但一致性問題始終存在(文章開頭排除了原子性和鎖),只是發生的幾率在一點點慢慢變小了,方案的評估不僅要根據自身系統的業務場景,如讀寫比、併發量、一致性容忍度,還要考慮系統複雜度,投入產出比等,尋找最合適的方案。