一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。 面試開始, 直入正題。 面試官: 你有沒有參與過秒殺系統的設計? 我: 沒有,我平時都是開發後臺管理系統、OA辦公系統、內部管理系統,從來沒有開發過秒殺系統。 面試官: 嗯... ...
一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。
面試開始, 直入正題。
面試官: 你有沒有參與過秒殺系統的設計?
我: 沒有,我平時都是開發後臺管理系統、OA辦公系統、內部管理系統,從來沒有開發過秒殺系統。
面試官: 嗯...,小伙子很實誠。今天就先到這裡吧,後面有消息會主動聯繫你。
後面還可能有消息嗎?你們啥時候主動聯繫過我?
實話實說的被拒,八股文背的溜反而被錄取。
好吧,等我看看一燈怎麼總結的秒殺系統的八股文。
我: 參與過秒殺系統,並獨立負責過秒殺系統的架構設計(【狗頭】是的,都是我設計的)。
面試官: 這樣才對,這樣我才能接著往下問。你在設計秒殺系統的時候,怎麼防止商品超賣?比如活動中只有一臺iPhone,最終賣出100台,肯定不行,平臺要虧錢。
我: 肯定要加鎖,不過由於秒殺系統請求量較大,一般使用分散式集群。而Java自帶Synchronized、ReentrantLock鎖只能用在單機系統中,這時候就需要用到分散式鎖。
面試官: 你提到分散式鎖,分散式鎖都有哪些作用?
八股文這就開始了。
我:我覺得分散式鎖主要有兩個作用:
保證數據的正確性:
比如:秒殺的時候防止商品超賣,表單重覆提交,介面冪等性。
避免數據重覆處理:
比如:調度任務在多台機器重覆執行,緩存過期所有請求都去載入資料庫。
總結八股文,還得是一燈。
面試官: 小伙子總結的挺全,你知道設計一個分散式鎖,要具有哪些特性?
我: 我覺得分散式鎖要具有以下這些特性:
互斥:同一時刻只能有一個線程獲得鎖。
可重入:當一個線程獲取鎖後,還可以再次獲取這個鎖,避免死鎖發生。
高可用:當小部分節點掛掉後,仍然能夠對外提供服務。
高性能:要做到高併發、低延遲。
支持阻塞和非阻塞:Synchronized是阻塞的,ReentrantLock.tryLock()就是非阻塞的
支持公平鎖和非公平鎖:Synchronized是非公平鎖,ReentrantLock(boolean fair)可以創建公平鎖
面試官: 小伙子,有點東西。你是怎麼設計一個分散式鎖?
我: 有幾種常用的工具都可以實現分散式鎖。
比如:關係型資料庫(例如:MySQL)、分散式資料庫(例如:Redis)、分散式協調服務框架(例如:zookeeper)
使用MySQL實現分散式鎖比較簡單,建一張表:
CREATE TABLE `distributed_lock` (
`id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵ID',
`resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '資源名稱(唯一索引)',
PRIMARY KEY (`id`),
UNIQUE KEY `uk_resource_name` (`resource_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分散式鎖';
獲取鎖的時候,就插入一條記錄。插入成功就代表獲取到鎖,插入失敗就代表獲取鎖失敗。
INSERT INTO distributed_lock (`resource_name`) VALUES ('資源1');
釋放鎖的時候,就刪除這條記錄。
DELETE FROM distributed_lock WHERE resource_name = '資源1';
實現比較簡單,不過還不能用於實際生產中,有幾個問題沒有解決:
- 這把鎖不支持阻塞,insert失敗立即就返回了。當然可以用while迴圈直到插入成功,不過自旋也會占用CPU。
- 這把鎖不是可重入的,已經獲取到鎖的線程再次插入也會失敗,我們可以增加兩列,一列記錄獲取到鎖的節點和線程,另一列記錄加鎖次數。獲取鎖,次數加一,釋放鎖,次數減一,次數為零就刪除這把鎖。
- 這把鎖沒有過期時間,如果業務處理失敗或者機器宕機,導致沒有釋放鎖,鎖就會一直存在,其他線程也無法獲取到鎖。我們可以增加一列鎖過期時間,再啟動一個非同步任務掃描過期時間大於當前時間的鎖就刪除。
就是這麼麻煩,我們看一下優化之後的鎖變成什麼樣了:
CREATE TABLE `distributed_lock` (
`id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵ID',
`resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '資源名稱(唯一索引)',
`owner` varchar(200) NOT NULL DEFAULT '' COMMENT '鎖持有者(機器碼+線程名稱)',
`lock_count` int NOT NULL DEFAULT '0' COMMENT '加鎖次數',
`expire_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '鎖過期時間',
PRIMARY KEY (`id`),
UNIQUE KEY `uk_resource_name` (`resource_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分散式鎖';
這下應該完美了吧?不行,還有個問題:
業務邏輯沒處理完,鎖過期了怎麼辦?
假如我們設置鎖過期時間是6秒,正常情況下業務邏輯可以在6秒內處理完成,但是當JVM發生FullGC或者調用第三方服務出現網路延遲,業務邏輯還沒處理完,鎖已經過期,被刪掉,然後被其他線程獲取到鎖,豈不是要出問題?
這就引入了另一個知識點“鎖續期”:
獲取鎖的同時,啟動一個非同步任務,每當業務執行到三分之一時間,也就是6秒中的第2秒的時候,就自動延長鎖過期時間,繼續延長到6秒,這樣就能保證業務邏輯處理完成之前鎖不會過期。
面試官: 小伙子,分散式鎖算是讓你玩明白了。我還想繼續問,生產中一般很少用MySQL做分散式鎖,因為MySQL併發性能跟不上。剛纔提到Redis也可以實現分散式鎖,你知道該怎麼實現嗎?
我當然知道,八股文就要背全套。
我: 使用Redis實現分散式鎖,跟使用MySQL類似,也需要解決實現過程中遇到的各種問題,不過解決方案稍有不同。
最簡單的獲取鎖方式:
// 1. 獲取鎖
redis.setnx('resource_name1', 'owner1')
// 2. 釋放鎖
redis.del('resource_name1')
當“resource_name1”不存在時,set成功,也就是獲取鎖成功。
不過還需要加上過期時間,防止沒有釋放鎖。
// 1. 獲取鎖
redis.setnx('resource_name1', 'owner1')
// 2. 增加鎖過期時間
redis.exprire('resource_name1', 6, TimeUnit.SECONDS)
又引入新問題了,兩條命令不是原子的,可能獲取鎖之後還沒來得及設置過期時間就宕機了,這該怎麼辦?
好辦,在Redis 2.6.12之後,提供一條複合命令:
redis.set('resource_name1', 'owner1',"NX" "EX", 6)
還有一個問題,釋放鎖的時候,並沒有判斷鎖的持有者,有可能把其他線程持有的鎖給釋放了,這可不行,可以這樣做:
// 釋放鎖
if ('owner1'.equals(redis.get('resource_name1'))){
redis.del('resource_name1')
}
這樣行不行呢?還不行,因為get和del兩條命令不是原子操作,需要引入Lua腳本把兩條命令打包成一條發給Redis執行:
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
redis.eval(script, Collections.singletonList('resource_name1'), Collections.singletonList('owner1'))
這樣總行了吧?還不行,還有個“鎖續期”的問題沒有解決。
更簡單了,Redis客戶端Redisson已經幫我們實現續期的功能,叫“WatchDog”(看門狗),在我們調用lock自動喚醒“看門狗”。
面試官: 小伙子,你可真行啊。你再講一下使用zookeeper怎麼實現分散式鎖?
我: zookeeper採用樹形節點,類似Linux目錄文件結構,同一目錄下的節點名稱不能重覆。
節點有分為四種類型:
持久節點: 一旦創建,永久存儲在伺服器上,除非手動刪除。
臨時節點: 生命周期與客戶端綁定,客戶端斷開連接,節點就被自動刪除。
持久順序節點: 特性同持久節點,只是在節點名稱後面追加自增有序數字。
臨時順序節點: 特性同臨時節點,只是在節點名稱後面追加自增有序數字。
zookeeper還有個監聽-通知機制,客戶端可以在資源節點上創建watch事件。當節點發生變化,會通知客戶端,客戶端可以根據變化做相應的業務處理。
我們可以利用臨時順序節點的特性創建分散式鎖,分以下三步:
- 在資源/resource1目錄下創建臨時順序節點node
- 獲取/resource1目錄下的所有節點,如果當前節點序號最小,代表加鎖成功
- 如果不是,就是watch監聽序號最小的節點
實現邏輯很簡單,我們來分析一下zookeeper實現分散式鎖的優點:
- 由於創建的臨時節點,斷開連接後自動刪除,所以無需設置鎖超時時間,也就不用考慮不釋放和鎖續期
- 由於節點上存儲的創建人信息,鎖也就支持可重入
- 由於可以監聽節點,也就實現了可阻塞
面試官: 小伙子,升級加薪的機會就是留給你這樣的人。薪資double,明天就來上班吧。
總結:
關於分散式鎖的所有知識點,雖然很多,但都已經總結在這張圖上了,歡迎點贊收藏轉發評論。