Swarm集群編排 什麼是Swarm Swarm是Docker公司自研發的容器集群管理系統,Swarm在早期是作為一個獨立服務存在,在Docker Engine v1.12中集成了Swarm的集群管理,和編排功能。可以通過初始化Swarm或加入現有Swarm來啟用Docker引擎的Swarm模式 ...
Swarm集群編排
什麼是Swarm
Swarm是Docker公司自研發的容器集群管理系統,Swarm在早期是作為一個獨立服務存在,在Docker Engine v1.12中集成了Swarm的集群管理,和編排功能。可以通過初始化Swarm或加入現有Swarm來啟用Docker引擎的Swarm模式。
Docker Engine CLI和API包括了管理Swarm節點命令,比如添加、刪除節點,以及在Swarm中部署和編排服務,也增加了服務棧(Stack)、服務(Service)、任務(Task)概念
Swarm能幹什麼
Swarm是Docker 引擎內置(原生)的集群管理和編排工具。Docker Swarm是 Docker 官方三劍客項目之一,swarm是基於docker平臺實現的集群技術,他可以通過幾條簡單的指令快速的創建一個docker集群,接著在集群的共用網路上部署應用,最終實現分散式的服務。
swarm節點
swarm是一系列節點的集合,而節點可以是一臺裸機或者一臺虛擬機。一個節點能扮演一個或者兩個角色,manager或者worker。
manager節點
Docker Swarm集群需要至少一個manager節點,節點之間使用
Raft consensus protocol
進行協同工作。
通常,第一個啟用docker swarm的節點將成為leader,後來加入的都是follower。當前的leader如果掛掉,剩餘的節點將重新選舉出一個新的leader。
每一個manager都有一個完整的當前集群狀態的副本,可以保證manager的高可用。
worker節點
worker節點是運行實際應用服務的容器所在的地方。理論上,一個manager節點也能同時成為worker節點,但在生產環境中,我們不建議這樣做。
worker節點之間,通過control plane
進行通信,這種通信使用gossip
協議,並且是非同步的。
運行機制
名詞解釋
集群中經常談到的stacks, services, tasks,他們之間的關係。
下麵簡單解釋一下這三者的含義:
task
在Docker Swarm中,task是一個部署的最小單元,task與容器是一對一的關係。
services
swarm service是一個抽象的概念,它只是一個對運行在swarm集群上的應用服務,所期望狀態的描述。它就像一個描述了下麵物品的清單列表一樣:
- 服務名稱
- 使用哪個鏡像來創建容器
- 要運行多少個副本
- 服務的容器要連接到哪個網路上
- 應該映射哪些埠
stack
stack是描述一系列相關services的集合。我們通過在一個YAML文件中來定義一個stack。
工作原理
服務、任務和容器
當將服務部署到集群時,管理者將服務定義視為服務所需狀態。然後將服務調度為一個或多個副本任務。這些任務在集群的節點上彼此獨立運行。
例如下圖有三個副本的HTTP服務,每個服務實例就是一個任務。
容器是一個獨立的進程,在swarm模型中,每個任務調用一個容器。任務類似於插槽,調度器將容器放入其中。一旦容器運行,調度器認為該任務處於運行狀態。如果容器出現健康監測失敗或者終止,那麼任務也終止。
副本和全局服務
有兩種類型的服務部署:副本和全局。
對於副本服務,指定要運行的相同任務的數量,每個副本都是相同的內容。
全局服務是在每個節點上運行一個任務的服務。不需要預先指定任務數量。每當將一個節點添加到集群中,協調者將創建一個任務,並且調度器將任務分配給該新加入的節點。全局服務最好是監控代理、反病毒掃描程式等等想要在集群中每個節點上運行的容器。
下圖顯示三個副本服務(黃色)和全局服務(灰色):
功能特點(瞭解)
集成的集群管理
使用Docker Engine CLI創建一組Docker引擎,您可以在其中部署應用程式服務。您不需要其他編排軟體來創建或管理群集。
節點分散式設計
Docker Engine不是在部署時處理節點角色之間的差異,而是在運行時處理角色變化。您可以使用Docker Engine部署兩種類型的節點,管理節點和工作節點。這意味著您可以從單個伺服器構建整個群集。
聲明性服務模型
Docker Engine使用聲明性方法來定義應用程式堆棧中各種服務的所需狀態。例如,您可以描述由具有消息隊列服務和資料庫後端的Web前端服務組成的應用程式。
可擴容與縮放容器
對於每個服務,您可以聲明要運行的任務數。當您向上或向下縮放時,swarm管理器通過添加或刪除任務來自動適應,以保持所需的任務數量來保證集群的可靠狀態。
容器容錯狀態協調
群集管理器節點不斷監視群集狀態,並協調您表示的期望狀態的實際狀態之間的任何差異。
例如,如果設置一個服務以運行容器的10個副本,並且托管其中兩個副本的工作程式電腦崩潰,則管理器將創建兩個新副本以替換崩潰的副本。 swarm管理器將新副本分配給正在運行和可用的worker節點上。
多主機網路
您可以為服務指定覆蓋網路。當swarm管理器初始化或更新應用程式時,它會自動為覆蓋網路上的容器分配地址。
服務發現
Swarm管理器節點為swarm中的每個服務分配唯一的DNS名稱,並負載平衡運行的容器。您可以通過嵌入在swarm中的DNS伺服器查詢在群中運行的每個容器。
負載平衡
您可以將服務的埠公開給外部負載平衡器。在內部,swarm允許您指定如何在節點之間分發服務容器。
預設安全
群中的每個節點強制執行TLS相互驗證和加密,以保護其自身與所有其他節點之間的通信。您可以選擇使用自簽名根證書或來自自定義根CA的證書。
滾動更新
在已經運行期間,您可以增量地應用服務更新到節點。 swarm管理器允許您控制將服務部署到不同節點集之間的延遲。如果出現任何問題,您可以將任務回滾到服務的先前版本。
準備環境
伺服器準備
我的三台測試機
IP地址 | 角色 | 主機名 |
---|---|---|
192.168.64.153 | manager | node1 |
192.168.64.154 | worker | node2 |
192.168.64.155 | worker | node3 |
伺服器埠開放
在創建集群前,如果開啟了防火牆,請確認三台主機的防火牆能讓swarm需求的埠開放,需要打開主機之間的埠,以下埠必須可用。在某些系統上,這些埠預設為打開。
- 2377:TCP埠2377用於集群管理通信
- 7946:TCP和UDP埠7946用於節點之間的通信
- 4789:TCP和UDP埠4789用於覆蓋網路流量
可以直接禁用系統防火牆來讓這些埠通信不受限制,一般測試環境我們都會禁用防火牆
systemctl stop firewalld(立即生效)
systemctl disable firewalld(重啟生效)
搭建Swarm集群
當首次安裝並使用Docker Engine時,預設情況下swarm模式是禁用的。當啟用swarm模式時,可以使用docker service 服務管理命令。
有兩種方式在swarm模式下運行引擎:
-
創建一個新的集群
-
加入現有集群
在生成環境中,集群模式提供具有集群管理功能的容錯平臺,以保證服務的可靠運行。
下麵我們就來搭建一個
swarm
集群
初始化集群
docker swarm init --advertise-addr 192.168.64.153(本機地址)
生成口令
生成管理節點口令
docker swarm join-token manager
生成執行節點口令
docker swarm join-token worker
其他節點加入集群
在第一個從節點執行加入 work的指令
docker swarm join --token SWMTKN-1-53p5t2rt9ud5j0owkl14boj2z8im6r60ddlzotgc4a8y93u1c2-8f6crxgyc9umayhxva1jv9t1w 192.168.64.153:2377
第二個節點執行加入work的命令
docker swarm join --token SWMTKN-1-53p5t2rt9ud5j0owkl14boj2z8im6r60ddlzotgc4a8y93u1c2-8f6crxgyc9umayhxva1jv9t1w 192.168.64.153:2377
查看swarm的節點
執行
docker node ls
查看swarm節點信息
docker node ls
AVAILABILITY狀態說明
-
Active 意味著調度程式可以將任務分配給節點。
-
Pause 意味著調度程式不會將新任務分配給節點,但現有任務仍在運行。
-
Drain 意味著調度程式不會向節點分配新任務。調度程式關閉所有現有任務併在可用節點上調度它們。
MANAGER STATUS狀態說明
顯示節點是屬於manager或者worker
-
沒有值 :表示不參與群管理的工作節點。
-
Leader :意味著該節點是使得群的所有群管理和編排決策的主要管理器節點。
-
Reachable: 意味著節點是管理者節點正在參與Raft共識。如果領導節點不可用,則該節點有資格被選為新領導者。
-
Unavailable :意味著節點是不能與其他管理器通信的管理器。如果管理器節點不可用,您應該將新的管理器節點加入群集,或者將工作器節點升級為管理器。
修改主機名
預設
centos
的主機名是localhost
,我們看上面,節點的主機名都是localhost
,我們修改以下
查看主機名
hostnamectl status
可以查看主機名
hostnamectl status
修改主機名
修改主機名使用
hostnamectl set-hostname NAME
命令可以進行修改,我們使用 node1,node2...方式命名我們的節點
#修改主機名
hostnamectl set-hostname node1
# 查看主機名
hostnamectl status
其他節點依次操作就可以
再次查看節點
再次查看swarm節點信息
docker node ls
添加節點標簽
因為我們用到了節點約束,所有啟動服務之前需要添加節點標簽
# 添加標簽
docker node update --label-add role=data node1
#查看節點標簽信息
docker node inspect node1|grep role
管理節點
升降級節點
無論您升級或降級節點,您應該始終在群中維護奇數個管理器節點,
升降級節點角色只能在管理節點上運行,應先升級工作節點為被選舉者,再降級領導者為工作節點,然後被選舉者成為領導者完成替換;
您可以將工作程式節點提升為manager角色。這在管理器節點不可用或者您希望使管理器離線以進行維護時很有用。 類似地,您可以將管理器節點降級為worker角色。
升級節點
要降級一個節點或一組節點,請從管理器節點運行
docker node promote 節點名稱
docker node promote pbui0rdry85e25i3bvhzmqw8h
升級節點後不會馬上生效,會進入
Reachable
狀態,如果leader節點關掉,當前節點會參與主節點競爭
降級節點
要升級一個節點或一組節點,請從管理器節點運行
docker node demote 節點名稱
docker node demote r7cv7prw1h2to9h1cpwxs9jhl
swam將節點降級後,再次查看節點命令不生效,需要到管理節點查看
節點退出swarm集群
docker swarm leave 命令可在所有節點上運行,值得註意的是,工作節點退出swarm集群後,在管理節點上依然保存著工作節點的節點信息,狀態為down,要刪除節點信息,可使用docker node rm 命令,當所有的節點都退出並且被刪除時,在管理節點上使用docker swarm leave,然後退出整個集群;
工作節點
在工作節點執行以下命令可以退出
swarm
節點
docker swarm leave
管理節點
在管理節點查看節信息
docker node ls
根據退出節點前後查看節點信息,可以發現退出的節點是down的狀態,並沒有刪除節點
刪除節點信息
在管理節點執行刪除命令
docker node rm 節點ID
docker node rm r7cv7prw1h2to9h1cpwxs9jhl
管理集群服務
管理集群服必須在manager角色的主機上
創建overlay網路
我們需要載多個伺服器中運行Docker容器集群,需要使用overlay網路,overlay網路用於連接不同機器上的docker容器,允許不同機器上的容器相互通信,同時支持對消息進行加密
docker network create --driver overlay learn-docker-overlay-network
創建服務
使用
docker service create
命令來創建服務
創建MySQL服務
docker service create \
-e MYSQL_ROOT_PASSWORD=root \
--mount type=bind,source=/tmp/etc/mysql,destination=/etc/mysql/mysql.conf.d/ \
--mount type=bind,source=/tmp/data/mysql,destination=/var/lib/mysql \
--replicas 1 \
--constraint 'node.labels.role == data' \
--name mysql \
--network learn-docker-overlay-network \
mysql:5.7.33
--replicas 1 表示在集群中創建1個服務
node.labels.role == data
表示節點需要創建在標簽是data
的節點上
可以查看swarm的進程
docker service ls
docker service ps mysql
創建nacos服務
nacos也是需要創建一個,但是節點是可以漂移的,不需要固定在某一臺機器
docker service create \
-e MODE=standalone \
--replicas 1 \
--name nacos \
--network learn-docker-overlay-network \
nacos/nacos-server
可以查看swarm的進程
docker service ls
docker service ps nacos
我們發現nacos運行在了 node3節點上
創建learn-docker-storage服務
我們創建learn-docker-storage服務,我們將該服務部署兩個節點
docker service create \
--name learn-docker-storage \
--replicas 2 \
--network learn-docker-overlay-network \
manager-hongbaoyu-java.itheima.net:8443/library/learn-docker-storage:1.0-SNAPSHOT
可以查看swarm的進程
docker service ls
docker service ps nacos
我們發現我們的存儲服務運行在兩個節點上
創建learn-docker-web服務
我們創建learn-docker-web服務,我們將該服務同樣部署兩個節點
docker service create \
--name learn-docker-web \
--replicas 2 \
--network learn-docker-overlay-network \
manager-hongbaoyu-java.itheima.net:8443/library/learn-docker-web:1.0-SNAPSHOT
可以查看swarm的進程
docker service ls
docker service ps nacos
創建learn-docker-gateway服務
我們創建learn-docker-gateway服務,因為是網關服務,我們只創建一個節點,因為需要對外暴漏埠,需要開放8888埠
docker service create \
-p 8888:8888 \
--name learn-docker-gateway \
--replicas 1 \
--network learn-docker-overlay-network \
manager-hongbaoyu-java.itheima.net:8443/library/learn-docker-gateway:1.0-SNAPSHOT
可以查看swarm的進程
docker service ls
docker service ps nacos
測試訪問微服務
因為在
node2
節點上,node2
節點IP是192.168.64.154
我們可以請求URL訪問
curl http://192.168.64.154:8888/employeapi/find/10001| python -m json.tool
查看某個服務日誌
通過
docker service logs 服務命
可以看到當前服務的日誌,但是這個服務有兩個容器在運行,所有能同時看到兩個容器的日誌
docker service logs learn-docker-storage
擴縮容服務
可以通過集群操作對集群進行擴縮容
擴容操作
我們將
learn-docker-storage
由兩個容器變為三個容器
docker service scale learn-docker-storage=3
這樣我們就把存儲服務變成了三台服務
縮容操作
同樣,使用該命令對
learn-docker-storage
進行縮容
docker service scale learn-docker-storage=2
刪除服務
我們可以嘗試把
learn-docker-gateway
刪除掉,刪除操作將會把整個服務的所有容器刪除
docker service rm learn-docker-gateway
本文由
傳智教育博學谷
教研團隊發佈。如果本文對您有幫助,歡迎
關註
和點贊
;如果您有任何建議也可留言評論
或私信
,您的支持是我堅持創作的動力。轉載請註明出處!