大家好啊,我是字母哥,今天寫一篇關於etcd的文章,其實網上也有很多關於etcd的介紹,我就簡明扼要,總結提煉,期望大家通過這一篇文章掌握etcd的核心知識以及編碼技能! 本文首先用大白話給大家介紹一下etcd是什麼?這部分內容網上已經有很多了。 etcd有哪些應用場景?這些應用場景的核心原理是什麼 ...
大家好啊,我是字母哥,今天寫一篇關於etcd的文章,其實網上也有很多關於etcd的介紹,我就簡明扼要,總結提煉,期望大家通過這一篇文章掌握etcd的核心知識以及編碼技能!
- 本文首先用大白話給大家介紹一下etcd是什麼?這部分內容網上已經有很多了。
- etcd有哪些應用場景?這些應用場景的核心原理是什麼?
- 最後不能光動嘴不動手。先搭建一個etcd單機版,再使用java的客戶端操作etcd數據。
本文旨在幫助大家理解etcd,從巨集觀角度俯瞰etcd全局,掌握etcd的基本操作技能。後續我還會寫一個系列的文章,將每一種應用場景代碼化,期待大家關註我和我的公眾號:字母哥雜談。後續計劃章節內容如下:
- 《搭建高可用etcd集群》
- 《基於etcd實現分散式鎖(java代碼實現)》
- 《基於etcd實現配置變更通知(java代碼實現)》
- 《基於etcd實現服務註冊與發現(java代碼實現)》
- 《基於etcd實現分散式系統節點leader選舉(java代碼實現)》
一、白話etcd與zookeeper
用過linux的朋友請舉手,好的,我看見了! 在 linux 中所有自動安裝的系統軟體配置文件都存儲在一個名為/etc
的目錄中。“d”表示distributed分散式,etcd為分散式模型,所以etcd的核心應用場景是:分散式系統的配置信息存儲。
網上很多文章上來第一句話照搬英文官網:etcd 是一個高度一致的分散式鍵值存儲系統。很多朋友看完就問了,這玩意和redis有啥區別? 筆者要說,真的不要這麼比,etcd從名字上就已經告訴你了,它是存儲配置信息(元數據)的。和redis在架構應用上就不在一個層面,它對標的產品應該是zookeeper。雖然zookeeper在很多java的分散式系統的應用中比較廣泛,但是etcd作為後起之秀,乘kubernetes的東風,大有超越zookeeper的趨勢。
- zookeeper是使用java寫的, etcd是使用go語言編寫的。zookeeper使用了TCP協議,其交互報文規則是完全自定義的,如果不使用zookeeper提供的SDK就無法操作數據。而etcd使用的是google的gRPC協議,普適性更好一些。
- zookeeper對於一次請求,開啟一個socket進行監聽。而etcd的監聽管道channel可以反覆被利用,從IO性能到系統資源的利用的角度,etcd無疑是更優秀的。
- zookeeper使用zab協議保證集群節點配置信息的一致性,etcd使用raft協議。期望詳細瞭解raft協議的,點擊《raft協議中文介紹》。
大部分功能和zookeeper都是一樣的,目前看java程式員用zookeeper的更多,其他程式員用etcd更多。都是基於習慣,但筆者推薦etcd。
二、etcd的4個核心機制
etcd以key-value的形式進行數據的存儲. 配合下麵的這四種機制,使得etcd的應用場景更加的廣泛.
- Prefix 機制:即首碼機制,也稱目錄機制,客戶端向etcd放入2個鍵值對配置, 假如一個key是“/test/key1" , 另一個key是"/test/key2". 則通過首碼"/test"查詢etcd,返回一個列表包含key為“/test/key1" 和"/test/key2"的鍵值對數據;
- Watch 機制:即監聽機制,watch機制針對某個key進行監聽,也支持針對首碼進行範圍監聽. 當被監聽的key 或首碼範圍發生變化的時候,客戶端會收到變更通知;
- Lease 機制:即租約機制(TTL,Time To Live),支持為key-value增加一個存活時間,超過這個時間key-value將過期被刪除. 支持解約(刪除key-value),續約(增加TTL時間)等操作.
- Revision 機制:每個key帶有一個 全局唯一的Revision 號,每一次事務加1,它是全局唯一的,所以通過Revision可以判定數據寫操作的順序,對於實現分散式鎖和隊列非常有幫助.
三、Leader選舉與客戶端交互
使用etcd的時候,為了保證高可用,通常採用集群的部署方式。部署奇數個節點,通常建議是3個或5個,因為etcd集群之間需要通過網路交互保證配置信息的一致性。分散式多節點保證了高可用,但是節點太多了也不好,越多的節點網路消耗越大。至於為什麼是奇數個?這就涉及到Leader選舉的問題,奇數個方便投票出結果。
etcd使用raft演算法保證集群內各個節點之間數據一致性。raft演算法將集群內的節點分為Leader, Follower, Candidate(候選人)這三個角色。
- 集群初始化的時候,每個節點都是Follower角色。通過raft演算法選舉投票,選出一個節點作為Leader。
- Leader作為主節點,與其他節點維持心跳,並同步數據至其他節點。
- 當Follower一段時間內沒有收到leader的心跳,就會將自己角色改為Candidate候選者,併發起一次新的選舉,選舉新的Leader。
客戶端在操作etcd集群數據的時候:
- 讀操作:客戶端可以訪問任意節點進行數據的讀操作
- 寫操作:客戶端訪問任意節點進行寫操作,如果該節點是Follower,則將請求轉發給Leader。由Leader負責數據的寫操作(增刪改),將數據持久化,並向Follower發送同步數據的消息。
四、etcd的應用場景
4.1. kubernetes大腦
目前,etcd的最典型的應用場景就是作為Kubernetes 集群的大腦。
如果把kubernetes比作一個大飯店,那麼etcd就是這個飯店的進銷存+客戶關係管理系統。
- kubernetes作為容器編排服務,將面向客戶提供的各種服務進行合理的資源分配,服務編排。
- 不可避免地,有一些kubernetes集群的配置和狀態數據,例如 pod 的數量、它們的狀態、命名空間等。需要有一個統一的記錄、管理的地方,它就是etcd。
最重要的是:etcd具備watch監聽的功能,一旦某個配置或者某個狀態發生變更,集群內所有的服務全都可以通過watch監聽機制實時獲取到消息,進而做出進一步的響應。 幾乎etcd的所有應用場景,都是基於watch監聽機制產生的,包括我們後面為大家介紹的服務註冊發現和訂閱通知。
4.2. 服務註冊與發現
其實kubernetes也利用etcd實現服務註冊發現機制,但是上面的那張圖不太好說明,我新畫了兩張圖說明etcd在實現服務註冊發現機制中的作用。
所謂的服務註冊實現原理就是:服務在啟動的時候,向etcd寫入一條配置數據,該條配置數據說明自己的服務名稱,服務ip地址,服務埠等信息。
所謂的服務發現實現原理舉例:服務C的某個實例希望訪問服務A,服務C向etcd詢問服務A的訪問地址,etcd響應結果:服務A有三個實例,地址列表如:xxx.xxx.xxx.xxx:埠
、yyy.yyy.yyy.yyy:埠
,zzz.zzz.zzz.zzz:埠
。服務C不需要訪問三個實例,訪問其中一個就可以得到結果,所以它按照自己的負載均衡演算法選了一個,這個就叫做:客戶端負載均衡。
4.3. 健康檢查與狀態變更通知
銜接上文:服務C下一次訪問服務A的時候,還需要訪問etcd麽?答案是不需要,它訪問過一次之後,就會自己維護一個服務A訪問地址的列表,除非這個列表發生變化,否則是不會再次去詢問etcd的。
那麼一個服務怎麼知道另一個服務的列表發生變化呢?比如:服務A的實例註冊狀態發生變化。可能是由於某種原因掛掉了,可能是OOM或者是網路問題等。
- 服務在註冊到etcd之後,會保存一個關於該服務的註冊配置信息,該註冊配置信息由一個TTL,etcd同時會與該服務維持心跳。一旦超過TTL時間,無法得到服務的心跳響應,etcd就認為該節點的健康狀態出現了問題,就會將該節點下線(註冊配置信息刪除)。
- 服務在註冊到etcd之後,會保持對etcd狀態數據變更的監聽,一旦獲取監聽結果:服務A的實例狀態發生變更,該服務就會從etcd重新拉取服務A的註冊列表。
4.4.分散式鎖
跨進程跨系統的多線程操作公共資源,發生多線程競爭,為了避免線程不安全,需要使用分散式鎖。如果多線程在單個進程內發生資源競爭,就是用Lock就可以了,不需要分散式鎖。比如:你在mysql庫裡面有一個用戶餘額數據,多個進程內的線程同時更改這個值,可能發生併發的數據覆蓋。為了避免這樣的問題,多個進程排排隊,A先來,A釋放了鎖B再來,B釋放了鎖C再來。
舉例:上圖的3個client代表三個服務,都要操作某個資源數據。
- 在嘗試調用加鎖API的時候,client1獲取到的revision=1,它優先獲得加鎖的資格。加鎖就是加一個帶有revision的配置記錄。其他的所有的服務,都通過watch機制監聽鎖的釋放。
- client在嘗試調用加鎖API的時候,被分配了revision。並且按照revision進行了排序,監聽距離自己revision差值最小,而且小於自己的Revision,不會產生驚群效應。
4.5.實現消息隊列(純扯淡)
我覺得使用etcd實現消息隊列,是一種純扯淡的做法。如果大家有什麼異議,歡迎留言!
不是說做不了,確實寫個demo是可以的。往etcd裡面放數據,再通過watch機制進行監聽,這不就是一個典型的消息隊列麽?扯淡!如果我只為了實現消息數據的發佈訂閱,其實有很多辦法,我還用搭一個etcd集群?Spring的Event機制,java的響應式編程,哪怕自己搞一個BlockQueue呢,是不是都能實現消息的發佈訂閱。
我們之所以使用kafka、RocketMQ這樣的消息隊列,肯定是因為我們的非同步數據達到一定的規模了。達到規模的非同步消息數據傳遞根本就不是etcd的應用場景,正如本文開頭所述:別忘了它叫做etc阿就d,它就是一個為分散式系統存儲配置信息的,不是消息中間件。
五、etcd安裝
本文為大家安裝一個可以用於實驗環境的etcd單機版,我們可以用它進行實驗,後續我還會寫文章介紹etcd集群的安裝方式.
下載etcd的安裝包,訪問github-etcd,我使用的是linux操作系統64位,所以下載的安裝包是:etcd-v3.5.4-linux-amd64.tar.gz .如果網路條件不允許,可以搜索"etcd國內下載加速",選擇合適的下載安裝包進行安裝即可.
首先將安裝包解壓,解壓之後cd進入安裝目錄,將etcd和etcdctl兩個命令copy到/usr/local/bin/
目錄下麵.
tar zxvf etcd-v3.5.4-linux-amd64.tar.gz;
cd etcd-v3.5.4-linux-amd64;
cp etcd etcdctl /usr/local/bin/;
通過etcd --version
命令查看etcd的版本,同時可以驗證安裝結果.如果不想敲全路徑,可以把/usr/local/bin
目錄加入系統的PATH環境變數.
/usr/local/bin/etcd --version
啟動etcd,這裡的listen-client-urls和advertise-client-urls配置的作用是允許遠程連接,0.0.0.0
表示監聽當前伺服器的所有ip, 監聽埠是2379. 假如你的伺服器有多塊網卡,多個固定ip,你想指定etcd服務在某一個ip上提供服務,就可以用這個ip替換0.0.0.0
/usr/local/bin/etcd --listen-client-urls 'http://0.0.0.0:2379' --advertise-client-urls 'http://0.0.0.0:2379'
etcd啟動之後, 可以通過etcdctl命令向etcd中添加配置,如下所示使用put命令添加一個key=/dir1
,value=aaa
的鍵值對數據.可以使用get命令獲取該配置信息.
# /usr/local/bin/etcdctl put /dir1 aaa
OK
# /usr/local/bin/etcdctl get /dir1
/dir1
aaa
六、jetcd的編碼實現配置管理
下麵為大家介紹通過java API的方式操作etcd的數據,首先通過maven的坐標引入jetcd.我使用的版本相對比較舊,最新的版本已經是0.7.8,不過我在使用的時候出現了與netty版本不一致的情況,報錯:找不到netty相關的一些類.所以我就回退到0.3.0版本,使用方式上都是一樣的.
<dependency>
<groupId>io.etcd</groupId>
<artifactId>jetcd-core</artifactId>
<version>0.3.0</version>
</dependency>
下麵的代碼是使用jetcd操作etcd的配置數據,實現了數據的寫操作,讀操作,刪除操作.詳細用法看代碼吧.下麵的代碼是Junit 5的單元測試用例的寫法.
import io.etcd.jetcd.ByteSequence;
import io.etcd.jetcd.Client;
import io.etcd.jetcd.KV;
import io.etcd.jetcd.kv.GetResponse;
import io.etcd.jetcd.kv.PutResponse;
import org.junit.jupiter.api.*;
import java.nio.charset.StandardCharsets;
import java.util.concurrent.CompletableFuture;
import java.util.concurrent.ExecutionException;
import static junit.framework.TestCase.assertNotNull;
//這個註解配合函數的Order註解,決定測試用例函數的執行順序
@TestMethodOrder(MethodOrderer.OrderAnnotation.class)
public class EtcdTest {
private static Client etcdClient;
@BeforeAll
static void init(){
etcdClient = Client.builder()
//這裡的etcd服務列表可以寫多個,用逗號分隔
.endpoints("http://192.168.161.3:2379".split(","))
.build();
}
@Test
@Order(1)
@DisplayName("etcd寫配置操作")
void putKV() throws ExecutionException, InterruptedException {
KV kv = etcdClient.getKVClient();
ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
ByteSequence value = ByteSequence.from("value-str", StandardCharsets.UTF_8);
//put key-value配置信息
CompletableFuture<PutResponse> putRsp = kv.put(key,value);
assertNotNull(putRsp.get().getHeader());
}
@Test
@Order(2)
@DisplayName("etcd讀配置操作")
void getKV() throws ExecutionException, InterruptedException {
KV kv = etcdClient.getKVClient();
ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
//通過key獲取值
CompletableFuture<GetResponse> getRsp = kv.get(key);
String getBackValue = getRsp.get().getKvs().get(0).getValue().toString(StandardCharsets.UTF_8);
System.out.println("從etcd通過key獲取value值為:" + getBackValue);
}
@Test
@Order(3)
@DisplayName("刪除配置操作")
void deleteKV() {
KV kv = etcdClient.getKVClient();
ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
//通過key刪除數據
kv.delete(key);
}
}
上面的代碼只介紹了etcd的最基本的key-value操作,其實etcd客戶端還提供了很多的API,這些都將在我後續的文章中分散式鎖,服務註冊發現,配置變更監聽,分散式系統Leader選舉的內容中為大家介紹.
//租約
Lease lease=etcdClient.getLeaseClient();
//監聽
Watch watch =etcdClient.getWatchClient();
//選舉
Election election =etcdClient.getElectionClient();
//鎖
Lock lock=etcdClient.getLockClient();
歡迎關註我的公告號:字母哥雜談,回覆003贈送作者專欄《docker修煉之道》的PDF版本,30餘篇精品docker文章。字母哥博客:zimug.com