一提到負載均衡,相信很多同學都直接會想到nginx反向代理,因為我們平時比較熟悉的就是用nginx做web服務的負載均衡。其實nginx只是負載均衡里的一部分,在web應用中的每個層級其實都涉及到負載均衡。 那麼何為負載均衡?這個概念其實也同樣很重要,很多同學又說了,負載均衡還不簡單,就是在分散式系 ...
一提到負載均衡,相信很多同學都直接會想到nginx反向代理,因為我們平時比較熟悉的就是用nginx做web服務的負載均衡。其實nginx只是負載均衡里的一部分,在web應用中的每個層級其實都涉及到負載均衡。
那麼何為負載均衡?這個概念其實也同樣很重要,很多同學又說了,負載均衡還不簡單,就是在分散式系統中,將客戶端的請求均勻的分配到服務端(或者說將上游的請求,均衡的分配到下游的多個操作單元中),其實這隻回答了一半。請求的均衡是一方面,另一方面,數據也是要均衡的分佈在操作單元中的。
因此,負載均衡就是將請求/數據【均勻】分攤到多個操作單元上執行。
常見負載均衡方案
梳理下web應用的基本架構:
正常的web分散式項目的基本架構層級就是這樣(多台機器的集群我省略沒畫),分為客戶端層、反向代理nginx層、站點層、服務層、數據層。
【客戶端層->反向代理層】的負載均衡
【客戶端層】到【反向代理層】的負載均衡,是通過“DNS輪詢”實現的:DNS-server對於一個功能變數名稱配置了多個解析ip,每次DNS解析請求來訪問DNS-server,會輪詢返回這些ip,保證每個ip的解析概率是相同的。這些ip就是nginx的外網ip,以做到每台nginx的請求分配也是均衡的。
【反向代理層->站點層】的負載均衡
【反向代理層】到【站點層】的負載均衡,是通過“nginx”實現的。通過修改nginx.conf,可以實現多種負載均衡策略:比如輪詢,最少連接路由,ip 哈希等等。
【站點層->服務層】的負載均衡
【站點層】到【服務層】的負載均衡,是通過“服務連接池”實現的。
【數據層】的負載均衡
在數據量很大的情況下,由於數據層(db,cache)涉及數據的水平切分,所以數據層的負載均衡更為複雜一些,它分為“數據的均衡”,與“請求的均衡”。
數據的均衡是指:水平切分後的每個服務(db,cache),數據量是差不多的。
請求的均衡是指:水平切分後的每個服務(db,cache),請求量是差不多的。
常見的水平切分方式有這麼幾種:
一、按照range水平切分:
每一個數據服務,存儲一定範圍的數據,比如 db1服務,存儲uid範圍1-1kw; db2服務,存儲uid範圍1kw-2kw。
這個方案的好處是:
(1)規則簡單,service只需判斷一下uid範圍就能路由到對應的存儲服務
(2)數據均衡性較好
(3)比較容易擴展,可以隨時加一個uid[2kw,3kw]的數據服務
不足是:
(1)請求的負載不一定均衡,一般來說,新註冊的用戶會比老用戶更活躍,大range的服務請求壓力會更大。
二、按照id哈希水平切分
每一個數據服務,存儲某個key值hash後的部分數據,比如 db1服務,存儲偶數uid數據; db2服務,存儲奇數uid數據。
這個方案的好處是:
(1)規則簡單,service只需對uid進行hash能路由到對應的存儲服務
(2)數據均衡性較好
(3)請求均勻性較好
不足是:
(1)不容易擴展,擴展一個數據服務,hash方法改變時候,可能需要進行數據遷移。
大伙兒有沒有發現,在分散式系統的架構設計上, 擴展性也是要經常考慮的因素哦!