Hystrix 說到Hystrix就得先說一下產生的背景等等,那就是雪崩效應. 在微服務中肯定存在多個服務層之間的調用,基礎服務的故障可能會導致級聯故障,進而造成整個系統不可用的情況,這種現象被稱為服務雪崩效應. 簡單的來說就是一種因"服務提供者"的不可用導致"服務消費者"的不可用,並將不可用逐漸放 ...
Hystrix
說到Hystrix就得先說一下產生的背景等等,那就是雪崩效應. 在微服務中肯定存在多個服務層之間的調用,基礎服務的故障可能會導致級聯故障,進而造成整個系統不可用的情況,這種現象被稱為服務雪崩效應. 簡單的來說就是一種因"服務提供者"的不可用導致"服務消費者"的不可用,並將不可用逐漸放大的過程.如下圖所示:
A是服務提供者,B是A的消費者,CD是B的消費者(這也就是前面說的服務者和提供者並沒有明顯的界限,一個服務可以是提供者,也可能是其它服務的提供者). A的不可用引起了B的不可用,並將不可用逐漸放大到CD,服務雪崩就形成了.
那歸根結底,造成服務雪崩效應的原因如下:
- 服務提供者不可用
- 硬體故障
- 程式Bug
- 緩存擊穿
- 用戶大量請求
- 重試加大流量
- 用戶重試
- 代碼邏輯重試
- 服務調用者不可用
- 同步等待造成的資源耗盡
對於每一個原因都有對應的應對策略:
- 流量控制
- 網關限流
- 用戶交互限流
- 關閉重試
- 改進緩存模式
- 緩存預載入
- 同步改為非同步刷新
- 服務自動擴容
- AWS的auto scaling
- 服務調用者降級服務(Hystrix)
- 資源隔離
- 對依賴服務進行分類
- 不可用服務的調用快速失敗
而Hystrix就是為了預防鏈路雪崩效應產生的,下麵說說Hystrix的特性.
Hystrix的特性
服務降級(Fallback)
Fallback相當於降級操作.對於查詢操作,實現一個fallback方法,當請求後端服務出現異常的時候,可以使用fallback方法返回值,這個值一般是預設值或者來自緩存.
資源隔離
在 Hystrix 中,主要通過線程池來實現資源隔離。通常在使用的時候我們會根據調用的遠程服務劃分出多個線程池。例如調用產品服務的 Command 放入 A 線程池,調用賬戶服務的Command放入B線程池。這樣做的主要優點是運行環境被隔離開了。這樣就算調用服務的代碼存在 bug 或者由於其他原因導致自己所線上程池被耗盡時,不會對系統的其他服務造成影響。
這樣,通過對依賴服務實現線程池隔離,可以讓應用更健壯,不會因為個別依賴服務出現問題而引起非相關服務的異常.但是這樣要維護線程池會帶來額外的開銷, Netflix Hystrix 官方實例中,99%的情況下,使用線程池隔離的延遲有9ms,這個對於大多數需求來說幾乎是沒有影響;當然,如果覺得9ms的延遲開銷接受不了,並且依賴服務足夠可靠的情況下,可以使用信號模式來隔離資源,Hystrix在HystrixCommand 和 HystrixObservableCommand 中 2 處支持信號量的使用:
- 命令執行:如果隔離策略參數 execution.isolation.strategy 設置為 SEMAPHORE,Hystrix 會使用信號量替代線程池來控制依賴服務的併發控制。
- 降級邏輯:當 Hystrix 嘗試降級邏輯時候,它會在調用線程中使用信號量。
信號量的預設值為 10,也可以通過動態刷新配置的方式來控制併發線程的數量。
斷路器機制
當Hystrix Command請求後端服務失敗數量超過一定比例(預設50%), 斷路器會切換到開路狀態(Open). 這時所有請求會直接失敗而不會發送到後端服務. 斷路器保持在開路狀態一段時間後(預設5秒), 自動切換到半開路狀態(HALF-OPEN). 這時會判斷下一次請求的返回情況, 如果請求成功, 斷路器切回閉路狀態(CLOSED), 否則重新切換到開路狀態(OPEN). Hystrix的斷路器就像我們家庭電路中的保險絲, 一旦後端服務不可用, 斷路器會直接切斷請求鏈, 避免發送大量無效請求影響系統吞吐量, 並且斷路器有自我檢測並恢復的能力.
使用Feign Hystrix
熔斷一般是用在服務調用者層面,所以在上一個eureka項目中,修改調用者.在配置文件中添加
feign.hystrix.enabled=true
創建回調類:
@Component
public class HelloRemoteHystrix implements HelloRemote {
@Override
public String hello(@RequestParam(value = "name") String name) {
return "Hello World!!!";
}
}
添加fallback,修改遠程調用的介面
@FeignClient(name = "eureka-service-producter",fallback = HelloRemoteHystrix.class)
public interface HelloRemote {
/**
* 遠程調用提供者的hello
* @param name
* @return
*/
@GetMapping("/hello")
public String hello(@RequestParam("name") String name);
}
這個時候三個都啟動的話,訪問http://localhost:9010/hello/wangzhi會顯示提供者的helloController中hello方法返回的內容,這個時候將提供者服務關掉,再次訪問就會返回回調類的內容,也就是Hello World!!!
最後說一句,使用Hystrix,可以有效的防止雪崩,同時使系統具有自動降級和自動恢復服務的效果.
Hystrix Dashboard和Turbine
Hystrix-dashboard是一款針對Hystrix進行實時監控的工具,通過Hystrix Dashboard我們可以在直觀地看到各Hystrix Command的請求響應時間, 請求成功率等數據。但是只使用Hystrix Dashboard的話, 你只能看到單個應用內的服務信息, 這明顯不夠. 我們需要一個工具能讓我們彙總系統內多個服務的數據並顯示到Hystrix Dashboard上, 這個工具就是Turbine.
Hystrix Dashboard
創建標準的SpringBoot項目hystrix-dashborad-demo,添加依賴,添加註解,添加配置,代碼如下:
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
@EnableHystrixDashboard
@SpringBootApplication
public class HystrixDashboradDemoApplication {
public static void main(String[] args) {
SpringApplication.run(HystrixDashboradDemoApplication.class, args);
}
}
spring.application.name=hystrix-dashboard
server.port=11000
啟動就可以訪問了: localhost:11000/hystrix就可以看到界面了.
這個時候還沒完,因為這個hystrix dashborad是監控,所以必須有服務讓他監控,所以需要修改一下服務消費者,添加下麵依賴:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
添加註解
@SpringBootApplication
@EnableDiscoveryClient
@EnableFeignClients
@EnableHystrix
public class ServiceConsumerDemoApplication {
public static void main(String[] args) {
SpringApplication.run(ServiceConsumerDemoApplication.class, args);
}
}
添加配置
server.port=9010
spring.application.name=eureka-service-consumer
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
feign.hystrix.enabled=true
# 用來暴露 endpoints的,如果自身就是監控的話,可以不寫(http://www.ityouknow.com/springcloud/2017/05/18/hystrix-dashboard-turbine.html)
management.endpoints.web.exposure.include=hystrix.stream
上面的配置基本就OK了,之後全部啟動,訪問localhost:11000/hystrix,在第一行輸入 http://localhost:9010/actuator/hystrix.stream,點擊monitor stream就可以進入監控界面了.
進入監控界面會顯示loading,這個是等待你訪問,所以這個時候訪問localhost:9010/hello/wangzhi,這邊監控就會有結果展示了,重點看那6個顏色不同的數字就可以,右邊會有說明每個數字表示什麼!!!
Turbine
通過 Hystrix Dashboard,我們可以方便的查看服務實例的綜合情況,比如:服務調用次數、服務調用延遲等。但是僅通過 Hystrix Dashboard 我們只能實現對服務當個實例的數據展現,在生產環境我們的服務是肯定需要做高可用的,那麼對於多實例的情況,我們就需要將這些度量指標數據進行聚合。這個時候就要用到Turbine.
在前面的基礎上(也就是前面的系統要啟動),重新創建項目turbine-demo,添加依賴等等操作如下
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency>
spring.application.name=turbine
server.port=11001
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
turbine.app-config==eureka-service-consumer
turbine.cluster-name-expression=new String("default")
turbine.combine-host-port=true
@EnableTurbine
@SpringBootApplication
public class TrubineDemoApplication {
public static void main(String[] args) {
SpringApplication.run(TrubineDemoApplication.class, args);
}
}
配置文件參數說明:
- turbine.app-config參數指定了需要收集監控信息的服務名;
- turbine.cluster-name-expression 參數指定了集群名稱為 default,當我們服務數量非常多的時候,可以啟動多個 Turbine 服務來構建不同的聚合集群,而該參數可以用來區分這些不同的聚合集群,同時該參數值可以在 Hystrix 儀錶盤中用來定位不同的聚合集群,只需要在 Hystrix Stream 的 URL 中通過 cluster 參數來指定;
- turbine.combine-host-port參數設置為true,可以讓同一主機上的服務通過主機名與埠號的組合來進行區分,預設情況下會以 host 來區分不同的服務,這會使得在本地調試的時候,本機上的不同服務聚合成一個服務來統計。
這樣就可以啟動了,直接在瀏覽器訪問localhost:11001/turbin.stream就可以看到效果了.
這就是hystrix的使用和監控面板以及turbine的使用了,兩個監控哦.