Keepalived基本原理_ZenDei技術網路在線

Keepalived是Linux下一個輕量級別的高可用解決方案。高可用：廣義來講，是指整個系統的高可用行；狹義的來講就是主機的冗餘和接管。 ...

本文分享自天翼雲開發者社區《Keepalived基本原理》，作者:Ujnrfc

Keepalived簡介

Keepalived是Linux下一個輕量級別的高可用解決方案。高可用：廣義來講，是指整個系統的高可用行；狹義的來講就是主機的冗餘和接管。

它與HeartBeat實現類似的功能，都可以實現服務或者網路的高可用，但是又有差別，HeartBeat是一個專業的、功能完善的高可用軟體，它提供HA軟體所需的基本功能，比如：心跳檢測、資源接管，檢測集群中的服務，在集群節點轉移共用IP地址的所有者等等。HeartBeat功能強大，但是部署和使用相對比較麻煩，與HeartBeat相比，Keepalived主要是通過虛擬路由冗餘來實現高可用功能，雖然它沒有HeartBeat功能強大，但是Keepalived部署和使用非常的簡單，所有配置只需要一個配置文件即可以完成。

Keepalived起初是為LVS設計的，專門用來監控集群系統中各個服務節點的狀態，它根據TCP/IP參考模型的第三、第四層、第五層交換機制檢測每個服務節點的狀態，如果某個伺服器節點出現異常，或者工作出現故障，Keepalived將檢測到，並將出現的故障的伺服器節點從集群系統中剔除，這些工作全部是自動完成的，不需要人工干涉，需要人工完成的只是修複出現故障的服務節點。

Keepalived又加入了VRRP的功能，VRRP（VritrualRouterRedundancyProtocol,虛擬路由冗餘協議)出現的目的是解決靜態路由出現的單點故障問題，通過VRRP可以實現網路不間斷穩定運行，因此Keepalvied一方面具有伺服器狀態檢測和故障隔離功能，另外一方面也有HAcluster功能。

目前健康檢查和失敗切換是keepalived的兩大核心功能。所謂的健康檢查，就是採用tcp三次握手，icmp請求，http請求，udp echo請求等方式對負載均衡器後面的實際的伺服器(通常是承載真實業務的伺服器)進行保活；而失敗切換主要是應用於配置了主備模式的負載均衡器，利用VRRP維持主備負載均衡器的心跳，當主負載均衡器出現問題時，由備負載均衡器承載對應的業務，從而在最大限度上減少流量損失，並提供服務的穩定性。

VRRP協議與工作原理

在現實的網路環境中。主機之間的通信都是通過配置靜態路由或者(預設網關)來完成的，而主機之間的路由器一旦發生故障，通信就會失效，因此這種通信模式當中，路由器就成了一個單點瓶頸，為瞭解決這個問題，就引入了VRRP協議。

VRRP協議是一種容錯的主備模式的協議，保證當主機的下一跳路由出現故障時，由另一臺路由器來代替出現故障的路由器進行工作，通過VRRP可以在網路發生故障時透明的進行設備切換而不影響主機之間的數據通信。

虛擬路由器：虛擬路由器是VRRP備份組中所有路由器的集合，它是一個邏輯概念，並不是正真存在的。從備份組外面看備份組中的路由器，感覺組中的所有路由器就像一個一樣，可以理解為在一個組中：主路由器+所有備份路由器=虛擬路由器。虛擬路由器有一個虛擬的IP地址和MAC地址。主機將虛擬路由器當作預設網關。虛擬MAC地址的格式為00-00-5E-00-01-{VRID}。通常情況下，虛擬路由器回應ARP請求使用的是虛擬MAC地址，只有虛擬路由器做特殊配置的時候，才回應介面的真實MAC地址。

主路由器（MASTER）：虛擬路由器通過虛擬IP對外提供服務，而在虛擬路由器內部同一時間只有一臺物理路由器對外提供服務，這台提供服務的物理路由器被稱為主路由器。一般情況下Master是由選舉演算法產生，它擁有對外服務的虛擬IP，提供各種網路功能，如：ARP請求，ICMP數據轉發等。

備份路由器（BACKUP）：虛擬路由器中的其他物理路由器不擁有對外的虛擬IP，也不對外提供網路功能，僅接受MASTER的VRRP狀態通告信息，這些路由器被稱為備份路由器。當主路由器失敗時，處於BACKUP角色的備份路由器將重新進行選舉，產生一個新的主路由器進入MASTER角色，繼續提供對外服務，整個切換對用戶來說是完全透明的。

VRRP選舉機制

VRRP路由器在運行過程中有三種狀態：Initialize、Master、Backup。一般主路由器處於Master狀態，備份路由器處於Backup狀態。

VRRP使用選舉機制來確定路由器的狀態，優先順序如下：

1.VRRP組中IP擁有者。如果虛擬IP地址與VRRP組中的某台VRRP路由器IP地址相同，則此路由器為IP地址擁有者，這台路由器將被定位主路由器。

2.比較優先順序。如果沒有IP地址擁有者，則比較路由器的優先順序，優先順序的範圍是0~255，優先順序大的作為主路由器

3.比較IP地址。在沒有Ip地址擁有者和優先順序相同的情況下，IP地址大的作為主路由器。

如下圖所示，虛擬IP為10.1.1.254，在VRRP組中沒有IP地址擁有者，則比較優先順序，很明顯router_a和router_b的優先順序要大於router_c，則比較router_a和router_b的IP地址，router_a的IP地址大。所以router_a為組中的主路由器。

VRRP工作過程

路由器使用VRRP 功能後，會根據優先順序確定自己在備份組中的角色。優先順序高的路由器成為Master 路由器，優先順序低的成為Backup 路由器。Master 擁有對外服務的虛擬IP，提供各種網路功能，並定期發送VRRP 報文，通知備份組內的其他設備自己工作正常；Backup 路由器只接收Master 發來的報文信息，用來監控Master 的運行狀態。當Master 失效時，Backup 路由器進行選舉，優先順序高的Backup 將成為新的Master 。

主備切換邏輯如下：在搶占方式下，當Backup 路由器收到VRRP 報文後，會將自己的優先順序與報文中的優先順序進行比較。如果大於通告報文中的優先順序，則成為Master 路由器；否則將保持Backup狀態；在非搶占方式下，只要Master 路由器沒有出現故障，備份組中的路由器始終保持Master 或Backup 狀態，Backup 路由器即使隨後被配置了更高的優先順序也不會成為Master 路由器；如果Backup 路由器的定時器超時後仍未收到Master 路由器發送來的VRRP報文，則認為Master 路由器已經無法正常工作，此時Backup 路由器會認為自己是Master 路由器，並對外發送VRRP報文。備份組內的路由器根據優先順序選舉出Master 路由器，承擔報文的轉發功能。

Keepalvied的工作原理

Keepalived 包含以下組件：

core：是keepalived的核心，複雜主進程的啟動和維護，全局配置文件的載入解析等

check：負責healthchecker(健康檢查)，包括了各種健康檢查方式，以及對應的配置的解析包括LVS的配置解析

vrrp：vrrpd子進程，VRRPD子進程就是來實現VRRP協議的

libipfwc：iptables(ipchains)庫，配置LVS

libipvs：配置LVS

Keepalived 啟動後會通過healthchecker組件負責檢查各自伺服器的健康狀態，如果MASTER節點上服務不可用就會通過vrrpd組件切換到BACKUP狀態。

Keepalived工作在TCP/IP參考模型的三層、四層、五層（物理層，鏈路層）：

網路層（3）：Keepalived通過ICMP協議向伺服器集群中的每一個節點發送一個ICMP數據包(有點類似與Ping的功能)，如果某個節點沒有返迴響應數據包，那麼認為該節點發生了故障，Keepalived將報告這個節點失效，並從伺服器集群中剔除故障節點。

傳輸層（4）：Keepalived在傳輸層里利用了TCP協議的埠連接和掃描技術來判斷集群節點的埠是否正常，比如對於常見的WEB伺服器80埠。或者SSH服務22埠，Keepalived一旦在傳輸層探測到這些埠號沒有數據響應和數據返回，就認為這些埠發生異常，然後強制將這些埠所對應的節點從伺服器集群中剔除掉。

應用層（5）：Keepalived的運行方式也更加全面化和複雜化，用戶可以通過自定義Keepalived工作方式，例如：可以通過編寫程式或者腳本來運行Keepalived，而Keepalived將根據用戶的設定參數檢測各種程式或者服務是否允許正常，如果Keepalived的檢測結果和用戶設定的不一致時，Keepalived將把對應的伺服器從伺服器集群中剔除。