這篇文章主要介紹分散式系統中的非集中式結構,以及我們經常使用的三種基於非集中式架構的解決方案:Akka集群、Redis集群和Cassandra集群。 ...
非集中式結構
什麼是非集中式結構?
在非集中式結構中,服務的執行和數據的存儲被分散到不同的伺服器集群,伺服器集群之間通過消息傳遞進行通信和協調,非集中式結構沒有中央伺服器和節點伺服器之分,所有的伺服器地位都是平等的。
非集中式結構解決了集中式結構中面臨的單點瓶頸和單點故障問題,提升了系統的併發度,比較適合大規模集群的管理。
本文集中描述三種典型的非集中式架構系統:
- Akka集群
- Redis集群
- Cassandra集群
Akka集群
Akka是一個開發庫和運行環境,用於構建可擴展、彈性的、快速響應的應用程式。
Akka基於Actor模型實現,Actor模型是一個封裝了狀態和行為的對象,它接收消息並基於該消息執行計算。Actor之間通信的唯一機制就是消息傳遞,每個Actor都有自己的MailBox。
Actor發送的Mail信息會存儲在接收方的MailBox中,接受黨按照mail到達的先後順序,從MailBox中提取mail消息,併進行相應的計算處理。
Actor模型採用非同步消息調用機制,具有非阻塞、高性能等特點,可以用於處理併發問題。Akka集群充分利用了Actor模型的優勢,提供了一個非集中式架構的集群管理模塊,用來構建可擴展、彈性的分散式應用程式。
Akka集群中的節點分為Leader節點和非Leader節點,和非Leader節點相比,Leader節點只是增加了負責節點的加入和移出集群的功能。
對於數據同步,Akka集群採用的是誰的時間戳最新,就以誰為準的原則。Akka集群採用了Gossip協議,該協議是最終一致性協議,它的原理是每個節點周期性的從自己維護的集群節點列表中,隨機選擇k個節點,將自己存儲的數據信息發給著k個節點,接收到該信息的節點採用前面講的共識原則,對收到的數據和本地數據進行合併,這樣迭代幾個周期後,集群中所有節點上的數據信息就一致了。
Akka集群在創建時,節點被分為三種類型:
- 種子節點,使用靜態配置文件方式或者系統運行時指定方式,可以生成種子節點,種子節點是普通節點加入集群的聯繫點,可以自動接收新加入集群的節點的信息。
- 首種子節點,首種子節點是配置文件中的第一個種子節點,其功能是集群第一次啟動時,首種子節點啟動起來,集群才能組建成功,保證集群第一次創建時只有一個集群。
- 普通節點,可以向種子節點或集群中的任意節點發送Join消息,請求加入集群。
Akka集群的每個節點啟動後,讀取配置文件獲取種子節點列表,開始組建集群:
- 如果本節點是首種子節點,則把自己加入到集群列表,即以自己為中心構建集群。
- 如果本節點為種子節點,則向首種子節點請求加入集群,當首種子節點回覆同意消息後,可以加入集群,否則不可加入集群。
- 如果本節點為普通節點,則可以向任一種子節點請求加入集群,收到同意後,則加入集群,否則不可加入集群。
Redis集群
Redis是一個開源的、包含多種數據結構的高性能Key-value資料庫,主要有以下特征:
- 支持多種數據結構。
- 支持數據的持久化和備份。
- 基於記憶體運行,具有極高的性能。
Redis集群中不存在中央節點,每個節點都可以和其他節點通信,所有節點都負責存儲數據、記錄集群的狀態,客戶端可以訪問或者連接到任一節點上。
Redis集群中每個節點都存在主備,也就是說每台伺服器上都運行兩個Redis服務,分別是主備,主故障後,備升主。
在數據的分片存儲方面,Redis集群引入了”哈希槽“的概念,集群中內置了16384個哈希槽,每個節點負責一部分哈希槽,當客戶端要存儲一個數據或對象時,Redis先對key進行CRC16校驗,然後進行16384取模,來決定哈希槽的編號,從而確定存儲到哪個節點上。
Cassandra集群
Cassandra集群的架構是基於一致性哈希的完全P2P結構,沒有Master的概念,所有節點都是同樣的角色,徹底避免了因為單點問題導致的系統不穩定。Cassandra集群節點間的狀態同步,也是通過Gossip協議來進行P2P通信的。
Cassandra集群中每個節點都代表一個哈希值,每次客戶端可以向集群中的任意一個節點請求數據,接收到請求的節點將key值進行哈希操作,找出一致性哈希環上是哪個節點存儲該數據u,然後將請求轉發到相應節點上,並將查詢結果反饋返回給客戶端。
下麵是關於三種不同的非集中式架構系統的詳細比較。