Spring Cloud(三) --- hystrix_ZenDei技術網路在線

Hystrix 說到Hystrix就得先說一下產生的背景等等,那就是雪崩效應. 在微服務中肯定存在多個服務層之間的調用,基礎服務的故障可能會導致級聯故障,進而造成整個系統不可用的情況,這種現象被稱為服務雪崩效應. 簡單的來說就是一種因"服務提供者"的不可用導致"服務消費者"的不可用,並將不可用逐漸放 ...

Hystrix

說到Hystrix就得先說一下產生的背景等等,那就是雪崩效應. 在微服務中肯定存在多個服務層之間的調用,基礎服務的故障可能會導致級聯故障,進而造成整個系統不可用的情況,這種現象被稱為服務雪崩效應. 簡單的來說就是一種因"服務提供者"的不可用導致"服務消費者"的不可用,並將不可用逐漸放大的過程.如下圖所示:

A是服務提供者,B是A的消費者,CD是B的消費者(這也就是前面說的服務者和提供者並沒有明顯的界限,一個服務可以是提供者,也可能是其它服務的提供者). A的不可用引起了B的不可用,並將不可用逐漸放大到CD,服務雪崩就形成了.

那歸根結底,造成服務雪崩效應的原因如下:

服務提供者不可用
- 硬體故障
- 程式Bug
- 緩存擊穿
- 用戶大量請求
重試加大流量
- 用戶重試
- 代碼邏輯重試
服務調用者不可用
- 同步等待造成的資源耗盡

對於每一個原因都有對應的應對策略:

流量控制
- 網關限流
- 用戶交互限流
- 關閉重試
改進緩存模式
- 緩存預載入
- 同步改為非同步刷新
服務自動擴容
- AWS的auto scaling
服務調用者降級服務(Hystrix)
- 資源隔離
- 對依賴服務進行分類
- 不可用服務的調用快速失敗

而Hystrix就是為了預防鏈路雪崩效應產生的,下麵說說Hystrix的特性.

Hystrix的特性

服務降級(Fallback)

Fallback相當於降級操作.對於查詢操作,實現一個fallback方法,當請求後端服務出現異常的時候,可以使用fallback方法返回值,這個值一般是預設值或者來自緩存.

資源隔離

在 Hystrix 中，主要通過線程池來實現資源隔離。通常在使用的時候我們會根據調用的遠程服務劃分出多個線程池。例如調用產品服務的 Command 放入 A 線程池，調用賬戶服務的Command放入B線程池。這樣做的主要優點是運行環境被隔離開了。這樣就算調用服務的代碼存在 bug 或者由於其他原因導致自己所線上程池被耗盡時，不會對系統的其他服務造成影響。

這樣,通過對依賴服務實現線程池隔離,可以讓應用更健壯,不會因為個別依賴服務出現問題而引起非相關服務的異常.但是這樣要維護線程池會帶來額外的開銷, Netflix Hystrix 官方實例中,99%的情況下,使用線程池隔離的延遲有9ms,這個對於大多數需求來說幾乎是沒有影響;當然,如果覺得9ms的延遲開銷接受不了,並且依賴服務足夠可靠的情況下,可以使用信號模式來隔離資源,Hystrix在HystrixCommand 和 HystrixObservableCommand 中 2 處支持信號量的使用：

命令執行：如果隔離策略參數 execution.isolation.strategy 設置為 SEMAPHORE，Hystrix 會使用信號量替代線程池來控制依賴服務的併發控制。
降級邏輯：當 Hystrix 嘗試降級邏輯時候，它會在調用線程中使用信號量。

信號量的預設值為 10，也可以通過動態刷新配置的方式來控制併發線程的數量。

斷路器機制

當Hystrix Command請求後端服務失敗數量超過一定比例(預設50%), 斷路器會切換到開路狀態(Open). 這時所有請求會直接失敗而不會發送到後端服務. 斷路器保持在開路狀態一段時間後(預設5秒), 自動切換到半開路狀態(HALF-OPEN). 這時會判斷下一次請求的返回情況, 如果請求成功, 斷路器切回閉路狀態(CLOSED), 否則重新切換到開路狀態(OPEN). Hystrix的斷路器就像我們家庭電路中的保險絲, 一旦後端服務不可用, 斷路器會直接切斷請求鏈, 避免發送大量無效請求影響系統吞吐量, 並且斷路器有自我檢測並恢復的能力.

使用Feign Hystrix

熔斷一般是用在服務調用者層面,所以在上一個eureka項目中,修改調用者.在配置文件中添加

feign.hystrix.enabled=true

創建回調類:

@Component
public class HelloRemoteHystrix implements HelloRemote {

    @Override
    public String hello(@RequestParam(value = "name") String name) {
        return "Hello World!!!";
    }
}

添加fallback,修改遠程調用的介面

@FeignClient(name = "eureka-service-producter",fallback = HelloRemoteHystrix.class)
public interface HelloRemote {

    /**
     * 遠程調用提供者的hello
     * @param name
     * @return
     */
    @GetMapping("/hello")
    public String hello(@RequestParam("name") String name);

}

這個時候三個都啟動的話,訪問http://localhost:9010/hello/wangzhi會顯示提供者的helloController中hello方法返回的內容,這個時候將提供者服務關掉,再次訪問就會返回回調類的內容,也就是Hello World!!!

最後說一句,使用Hystrix,可以有效的防止雪崩,同時使系統具有自動降級和自動恢復服務的效果.

Hystrix Dashboard和Turbine

Hystrix-dashboard是一款針對Hystrix進行實時監控的工具，通過Hystrix Dashboard我們可以在直觀地看到各Hystrix Command的請求響應時間, 請求成功率等數據。但是只使用Hystrix Dashboard的話, 你只能看到單個應用內的服務信息, 這明顯不夠. 我們需要一個工具能讓我們彙總系統內多個服務的數據並顯示到Hystrix Dashboard上, 這個工具就是Turbine.

Hystrix Dashboard

創建標準的SpringBoot項目hystrix-dashborad-demo,添加依賴,添加註解,添加配置,代碼如下:

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>


@EnableHystrixDashboard
@SpringBootApplication
public class HystrixDashboradDemoApplication {

    public static void main(String[] args) {
        SpringApplication.run(HystrixDashboradDemoApplication.class, args);
    }

}


spring.application.name=hystrix-dashboard
server.port=11000

啟動就可以訪問了: localhost:11000/hystrix就可以看到界面了.

這個時候還沒完,因為這個hystrix dashborad是監控,所以必須有服務讓他監控,所以需要修改一下服務消費者,添加下麵依賴:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

添加註解

@SpringBootApplication
@EnableDiscoveryClient
@EnableFeignClients
@EnableHystrix
public class ServiceConsumerDemoApplication {

    public static void main(String[] args) {
        SpringApplication.run(ServiceConsumerDemoApplication.class, args);
    }

}

添加配置

server.port=9010
spring.application.name=eureka-service-consumer
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
feign.hystrix.enabled=true
# 用來暴露 endpoints的,如果自身就是監控的話,可以不寫(http://www.ityouknow.com/springcloud/2017/05/18/hystrix-dashboard-turbine.html)
management.endpoints.web.exposure.include=hystrix.stream

上面的配置基本就OK了,之後全部啟動,訪問localhost:11000/hystrix,在第一行輸入 http://localhost:9010/actuator/hystrix.stream,點擊monitor stream就可以進入監控界面了.

進入監控界面會顯示loading,這個是等待你訪問,所以這個時候訪問localhost:9010/hello/wangzhi,這邊監控就會有結果展示了,重點看那6個顏色不同的數字就可以,右邊會有說明每個數字表示什麼!!!

Turbine

通過 Hystrix Dashboard，我們可以方便的查看服務實例的綜合情況，比如：服務調用次數、服務調用延遲等。但是僅通過 Hystrix Dashboard 我們只能實現對服務當個實例的數據展現，在生產環境我們的服務是肯定需要做高可用的，那麼對於多實例的情況，我們就需要將這些度量指標數據進行聚合。這個時候就要用到Turbine.

在前面的基礎上(也就是前面的系統要啟動),重新創建項目turbine-demo,添加依賴等等操作如下

 <dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency>

spring.application.name=turbine
server.port=11001
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
turbine.app-config==eureka-service-consumer
turbine.cluster-name-expression=new String("default")
turbine.combine-host-port=true

@EnableTurbine
@SpringBootApplication
public class TrubineDemoApplication {

    public static void main(String[] args) {
        SpringApplication.run(TrubineDemoApplication.class, args);
    }

}

配置文件參數說明:

turbine.app-config參數指定了需要收集監控信息的服務名；
turbine.cluster-name-expression 參數指定了集群名稱為 default，當我們服務數量非常多的時候，可以啟動多個 Turbine 服務來構建不同的聚合集群，而該參數可以用來區分這些不同的聚合集群，同時該參數值可以在 Hystrix 儀錶盤中用來定位不同的聚合集群，只需要在 Hystrix Stream 的 URL 中通過 cluster 參數來指定；
turbine.combine-host-port參數設置為true，可以讓同一主機上的服務通過主機名與埠號的組合來進行區分，預設情況下會以 host 來區分不同的服務，這會使得在本地調試的時候，本機上的不同服務聚合成一個服務來統計。

這樣就可以啟動了,直接在瀏覽器訪問localhost:11001/turbin.stream就可以看到效果了.

這就是hystrix的使用和監控面板以及turbine的使用了,兩個監控哦.