這篇文章主要討論分散式系統中的分散式鎖問題,包括了三種不同的分散式鎖實現方式:基於資料庫的分散式鎖、基於緩存的分散式鎖和基於ZooKeeper的分散式鎖。 ...
分散式鎖
什麼是分散式鎖?
為了實現分散式互斥,我們需要在某個地方做個標記,這個標記是每個線程都可以看到,當標記不存在時可以設置該標記,當標記被設置後,其他線程只能等待擁有該標記的線程執行完成,並釋放該標記後,才能去設置該標記和訪問共用資源。這裡的標記就是我們討論的鎖。
鎖就是在多線程同時訪問同一資源的場景下,為了讓線程互不幹擾地訪問共用資源,從而保證操作的有效性和正確性的一種標記。
分散式鎖是指在分散式環境下,系統部署在多個機器中,實現多進程分散式互斥的一種鎖。為了保證多個進程都可以看到鎖,鎖需要通過公共存儲來管理,這樣才能實現多個進程併發訪問同一個臨界資源,同一個時刻只有一個進程可訪問共用資源,確保數據的一致性。
我們在設計分散式鎖時要考慮的因素有哪些?
以下幾點需要考慮:
- 互斥性,對於某一共用資源,需要保證在同一時間只能有一個線程或進程對該資源進行操作。
- 具備鎖失效機制,防止死鎖。
- 可重入性,即進程未釋放鎖時,可以多次訪問臨界資源。
- 有高可用的獲取鎖和釋放鎖的功能,且性能要好。
常見的分散式鎖實現方法有哪些?
實現分散式鎖有3種主流的方法:
- 基於資料庫實現分散式鎖
- 基於緩存實現分散式鎖
- 基於ZooKeeper實現分散式鎖
基於資料庫實現分散式鎖
基於資料庫實現分散式鎖比較簡單,主要在於創建一張鎖表,為申請者在鎖表中建立一條記錄,記錄建立成功則獲得鎖,消除記錄則釋放鎖。
因為需要頻繁訪問磁碟,IO開銷會比較大,因此這種方式適用於併發量低、對性能要求低的場景。
這種方式有兩個缺點:
- 單點故障問題,一旦資料庫不可用,會導致整個系統崩潰。
- 死鎖問題,資料庫鎖沒有失效時間,未獲得鎖的進程只能一致等待已獲得鎖的進程主動釋放鎖,如果已獲得共用資源訪問許可權的進程忽然掛了,或者解鎖操作失敗,那麼鎖記錄會一直存儲在資料庫中,無法刪除,而其他進程也無法獲得鎖,從而造成死鎖。
基於緩存實現分散式鎖
所謂基於緩存,也就是說把數據存放在電腦記憶體中,不需要寫入磁碟,減少IO讀寫。
我們經常使用Redis來作為緩存方案,使用setnx(key, value)函數實現分散式鎖。key和value就是基於緩存的分散式鎖的兩個屬性,其中key表示鎖id,value=currentTime + timeOut,表示當前時間+超時時間。
setnx函數的返回值有0和1:
- 返回1,說明該伺服器獲得鎖,setnx將key對應的value設置為當前時間+鎖的有效時間
- 返回0,說明其他服務已經獲得鎖,進程不能進入臨界區
Redis通過碎裂來維持進程訪問共用資源的先後順序,Redis鎖主要基於setnx函數實現分散式鎖,當進程通過setnx<key,value>函數返回1時,表示已經獲得鎖。排在後面的進程只能等待前面的進程主動釋放鎖,或者等到時間超時才能獲得鎖。
這種方案的優點在於:
- 性能更好,訪問記憶體要比訪問磁碟快很多。
- 可以集群部署,避免了單點故障問題。
- 使用方便,很多緩存服務都提供了可以用來實現分散式鎖的方法。
- 可以直接設置超時時間來控制鎖的釋放。
這種方案的缺點是通過超時時間來控制鎖的失效時間並不是十分可靠,因為一個進程執行時間可能比較長,或受系統進程做記憶體回收等影響,導致時間超時,從而不正確的釋放了鎖。
這種方案適用於高併發、對性能要求高的場景。
基於ZooKeeper的分散式鎖
ZooKeeper的樹形數據存儲結構主要由4種節點構成:
- 持久節點,預設節點類型。
- 持久順序節點,在創建節點時,ZooKeeper根據節點創建的時間順序對節點進行編號處理。
- 臨時節點,當客戶端與ZooKeeper斷開連接後,對應進程創建的臨時節點就會被刪除。
- 臨時順序節點,按時間順序編號的臨時節點。
ZooKeeper基於臨時順序節點實現了分佈鎖。
ZooKeeper實現分散式鎖的流程:
- 在持久節點shared_lock目錄下,為每個進程創建一個臨時順序節點。
- 每個進程獲取shared_lock目錄下的所有臨時節點列表,註冊Watcher,用於監聽子節點變更的信息。當監聽到自己的臨時節點是順序最小的,則可以使用共用資源。
- 每個節點確定自己的編號是否是shared_lock下所有子節點中最小的,如果是最小的,就能獲得鎖。
- 如果進程對應的臨時節點編號不是最小的,那麼有兩種情況:
- 本進程為讀請求,如果比自己序號小的節點中有寫請求,則等待。
- 本進程為寫請求,如果比自己序號小的節點中有請求,則等待。
使用ZooKeeper實現的分散式鎖,可以解決前兩種方法提到的各種問題,比如單點故障、不可重入、死鎖等,但是該方法實現比較複雜,且需要頻繁的添加和刪除節點,所以性能不如基於緩存實現的分散式鎖。
這種方案適用於大部分分散式場景,但是不適用於對性能要求極高的場景。
三種不同的分散式鎖,詳細的區別如下表所示。
分散式鎖中的羊群效應
所謂羊群效應,就是在整個ZooKeeper分散式鎖的競爭過程中,大量的進程都想要獲得鎖去使用共用資源。每個進程都有自己的Watcher來通知節點消息,都會獲取整個子節點列表,使得信息冗餘,資源浪費。
當共用資源被解鎖後,ZooKeeper會通知所有監聽的進程,這些進程都會嘗試爭取鎖,但最終只能有一個進程獲得鎖,使得其他進程產生了大量的不必要的請求,造成了巨大的通信開銷,造成網路阻塞,性能下降。
如何解決?分為三步:
- 在與該方法對應的持久節點目錄下,為每個進程創建一個臨時順序節點。
- 每個進程獲取所有臨時節點列表,對比自己的編號是否最小,如最小,則獲得鎖。
- 若本進程對應的臨時節點編號不是最小的,則註冊Watcher,監聽自己的上一個臨時順序節點,當監聽到該節點釋放鎖後,則獲取鎖。