Jedis Unexpected end of stream & java.net.SocketException: Broken pipe問題解決思路

来源:https://www.cnblogs.com/coderManFans/archive/2019/11/15/11868945.html
-Advertisement-
Play Games

筆者一直維護的穩定基礎服務測試環境不穩定了,這能忍!盤他,雖然不一定能完全盤的了。 背景: hrexternal 基礎服務對外提供公司員工獲取的多個介面,很多介面訪問頻率比較高,加了緩存,使用的是redis,但是redis最近2個月測試環境已經出問題了,時不時的報錯,之前流程平臺也報過錯,只不過是隨 ...


筆者一直維護的穩定基礎服務測試環境不穩定了,這能忍!盤他,雖然不一定能完全盤的了。

背景:

hrexternal 基礎服務對外提供公司員工獲取的多個介面,很多介面訪問頻率比較高,加了緩存,使用的是redis,但是redis最近2個月測試環境已經出問題了,時不時的報錯,之前流程平臺也報過錯,只不過是隨機的,不是必現的。當時也是沒有具體原因,只是將底層的redis實例換掉了。然後就好了,這個服務呢由於歷史原因還有很多其他服務是用的同一個redis實例,換的話需要好幾個服務一起換,保障穩定性。
這次出現的問題更嚴重,因為每隔幾分鐘就會報錯,get報錯,put也會報錯。所以就跟進排查了下。
Redis版本:3.0.7
Jedis版本:2.8.0
異常如下:
1573711317108_9EE07B61-20CC-48b1-908A-77D7D12866CB.png
1573711368303_86E3963F-15A1-4138-8101-85C9E14428F5.png

這倆異常不經常遇到,但是一旦遇到肯定是比較麻煩的。
筆者也是百度了很多,很多,從下麵的鏈接中瞭解到一些信息:

https://blog.csdn.net/aubdiy/article/details/53511410

也是按照上面的思路進行排查:

1.找DBA幫忙看redis是否有改動配置,沒有

2.看超時時間,客戶端沒有單獨設置連接參數,預設超時時間應該是2秒。

3.可能是網路問題。但是實際上不是。

4.根據jedis  github上面的issues討論內容發現具體原因也沒有說出來,但是出現這個問題的人確實挺多的。解決的人基本上都加了Jedis的連接配置了,剛好我們的沒有加,還有可能解決。

這裡就揭開了針對於Jedis配置的一場探索之路。
首先看這個hrexternal服務的jedis初始化代碼:

/**
     *  初始化資源池
     */
    static {
        try {
            if (jedisSentinelPool ==null) {
              logger.info("init JedisSentinelPool is start....");
                logger.info("redis_ip1:"+RedisConfig.redis_ip1+",redis_port1:"+RedisConfig.redis_port1);
                logger.info("redis_ip2:"+RedisConfig.redis_ip2+",redis_ip2:"+RedisConfig.redis_port2);
                logger.info("redis_ip3:"+RedisConfig.redis_ip3+",redis_ip2:"+RedisConfig.redis_port3);
              Set<String> sentinels = new HashSet<String>();
              sentinels.add(new HostAndPort(RedisConfig.redis_ip1, Integer.parseInt(RedisConfig.redis_port1)).toString());
              sentinels.add(new HostAndPort(RedisConfig.redis_ip2, Integer.parseInt(RedisConfig.redis_port2)).toString());
              sentinels.add(new HostAndPort(RedisConfig.redis_ip3, Integer.parseInt(RedisConfig.redis_port3)).toString());
              jedisSentinelPool = new JedisSentinelPool(RedisConfig.master, sentinels);
              logger.info(" init JedisSentinelPool is end....");
            }
        }catch(Exception e){
              logger.error("---->init JedisSentinelPool was failed,the msg is " + e.getMessage(), e);
        }
    }
    

    /**
     * 獲取資源
     * @return
     * @throws Exception
     */
    public static synchronized Jedis getJedis() throws Exception {
        try {
            if(jedisSentinelPool != null) {
                Jedis e = jedisSentinelPool.getResource();
                return e;
            } else {
                return null;
            }
        } catch (Exception e) {
            e.printStackTrace();
            logger.error(e);
            return null;
        }
    }

使用的是Jedis哨兵模式進行Jedis初始化,同時使用Jedis連接池。出現上面的異常很多原因都跟連接池的連接有關。因此有必要分析一下Jedis的連接池和連接配置參數,如下圖是Jedis連接配置參數和Jedis的連接池對象的類圖:
Pool.png
其中只有GenericObjectPoolConfig,BaseObjectPoolConfig不是Jedis中的類,其他都是。這倆類是jedis依賴的另一個jar包:

    <dependency>
            <groupId>org.apache.commons</groupId>
            <artifactId>commons-pool2</artifactId>
            <version>2.6.2</version>
            <type>jar</type>
            <scope>compile</scope>
        </dependency>

這個包是不是看著既熟悉又陌生。這個竟然是java對象池池化技術的一個實現,相關文章如下:

https://blog.51cto.com/andrewli/2148179

當然本文的分析內容也包括這個,其中Jedis的一些配置參數也跟這個池化對象配置有關。

下麵是我整理的一個配置參數介紹:

  1. maxTotal:程式允許創建資源的最大數量;預設值 -1,-1 代表無數量限制(int類型)
  2. blockWhenExhausted:當資源耗盡時,是否阻塞等待獲取資源;預設值 true
  3. maxWaitMillis: 獲取資源時的等待時間,單位毫秒。當blockWhenExhausted 配置為 true 時,此值有效。 -1 代表無時間限制,一直阻塞直到有可用的資源。(long類型)
  4. testOnBorrow: 否在從池中取出連接前進行檢驗,如果檢驗失敗,則從池中去除連接並嘗試取出另一個;預設值 false ,當設置為true時,調用 factory.validateObject() 方法
  5. testOnCreate 創建鏈接的時候進行鏈接有效性檢查; 預設值 false,當設置為true時,調用 factory.validateObject() 方法(備註:如果 testOnBorrow 或者 testOnCreate 中有一個 配置 為 true 時,就調用 factory.validateObject() )
  6. lifo 資源的存取數據結構,預設值 true,true 資源按照棧結構存取,false 資源按照隊列結構存取
  7. fairness 當從池中獲取資源或者將資源還回池中時 是否使用 java.util.concurrent.locks.ReentrantLock.ReentrantLock 的公平鎖機制。 預設值 false, true 使用公平鎖,false 不使用公平鎖,
  8. timeBetweenEvictionRunsMillis 回收資源線程的執行周期,單位毫秒。預設值 -1 ,-1 表示不啟用線程回收資源。(long類型)
  9. evictionPolicyClassName 資源回收策略, 預設值org.apache.commons.pool2.impl.DefaultEvictionPolicy(String類型)
  10. minEvictableIdleTimeMillis 連接在池中保持空閑而不被空閑連接回收器線程(如果有)回收的最小時間值; 預設值 1800000,單位 毫秒(long類型 )
  11. softMinEvictableIdleTimeMillis 軟資源最小空閑時間, 預設值 -1 ,單位 毫秒,(long類型 )(備註,這個兩個參數,在資源回收策略中,會使用到)
  12. maxIdle 最大空閑資源數,預設值 8 (int類型)
  13. minIdle 最小空閑資源數,預設值 0 (int類型 )
  14. testWhileIdle 指明連接是否被空閑連接回收器(如果有)進行檢驗.如果檢測失敗,則連接將被從池中去除;預設值 false; 設置為 true 時,當回收策略返回false時,則 調用 factory.activateObject()和factory.validateObject()
  15. testOnReturn 預設值 false; 設置為 true 時,當將資源返還個資源池時候,驗證資源的有效性,調用 factory.validateObject()方法,如果無效,則調用 factory.destroyObject()方法
  16. numTestsPerEvictionRun 資源回收線程執行一次回收操作,回收資源的數量。預設值 3, (int類型)。
    備註:當 設置為0時,不回收資源。
    設置為 小於0時,回收資源的個數為 (int)Math.ceil( 池中空閑資源個數 / Math.abs(numTestsPerEvictionRun) );設置為 大於0時,回收資源的個數為 Math.min( numTestsPerEvictionRun,池中空閑的資源個數 );

由於上面代碼的配置是使用預設的參數,也就是說當鏈接出現問題的時候你是不知道是客戶端出的問題還是服務端出的問題,跟DBA確認了一些服務端的參數:
client-output-buffer-limit normal 0 0 0
client-output-buffer-limit slave 512mb 128mb 60
client-output-buffer-limit pubsub 32mb 8mb 60
timeout 60 配置的60s。
由於服務端沒有動配置,客戶端沒有動配置,也沒有動代碼。封裝Jedis操作的每個API都檢查了,最後都有finally代碼塊保證jedis用完會close.
不存在鏈接泄露問題。那為啥上面的錯會發生?為啥穩定運行了很長時間最近才報錯。
當然幾個可能的方向

  1. 這個Redis實例被很多服務共用,導致數據錯亂或者Redis鏈接有問題。
  2. Jedis配置問題
  3. 版本問題。
    當我設置了jedis鏈接池參數之後就不會出現上面的異常了,配置代碼如下:
JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
                jedisPoolConfig.setTestOnBorrow(true);
                jedisPoolConfig.setTestOnReturn(true);
                jedisPoolConfig.setTestOnCreate(true);
                jedisPoolConfig.setMaxTotal(50);
                jedisPoolConfig.setMaxIdle(10);
                jedisPoolConfig.setMinIdle(1);
                jedisPoolConfig.setMaxWaitMillis(3000);
jedisSentinelPool = new JedisSentinelPool(RedisConfig.master, sentinels,jedisPoolConfig);

部署完之後,發現異常不再出現。
雖然具體原因沒有找到但是通過jedis開源代碼和issues可以得到一些結論:
https://github.com/xetorthio/jedis/issues/932
https://blog.csdn.net/SakuraInLuoJia/article/details/89874287

也就是說有2點建議

  1. 不建議用Jedis預設的鏈接池配置,需要根據自己的需要在構造Jedis鏈接池的時候傳入鏈接池配置。
  2. 將客戶端版本與服務端版本儘量保持一致。
    當然如果你遇到這種問題的話,通過上面的方式還是搞不定,說明你沒有找到正確的配置。即使有另一份配置放在你面前,它可能也不能解決你的問題,但至少是多了一種嘗試。

    本文由博客一文多發平臺 OpenWrite 發佈!
    架構設計@工程設計@服務穩定性之路


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 有的硬體晶元提供了一個個寄存器,供我們很好的操作i2c,但是,在用的時候,我們是不知道他到地是怎麼操作的,下邊,我就探討下i2c中的start和restart的區別。 start是在scl是高電平的時候sda的一個下降沿來表示一個i2c的開始信號,到了i2c傳輸的內部,scl是低電平的時候,所有數據 ...
  • 1 切換到 root 用戶 先臨時切換到root用戶(因為我不想每打一個命令都要在前面加上sudo) 然後,輸入密碼臨時切換到root用戶.如下圖: 2 配置IP 打開 /etc/network/interfaces 同時配置以下內容 具體的地址可以根據自己的情況來配置 gateway 即網關地址, ...
  • 一 部署ETCD集群 1.1 安裝ETCD etcd 是基於 Raft 的分散式 key-value 存儲系統,由 CoreOS 開發,常用於服務發現、共用配置以及併發控制(如 leader 選舉、分散式鎖等)。kubernetes 使用 etcd 存儲所有運行數據。 1 etcd 是基於 Raft ...
  • 一 部署 kubectl 1.1 安裝kubectl 1 [root@k8smaster01 ~]# cd /opt/k8s/work 2 [root@k8smaster01 work]# wget https://dl.k8s.io/v1.14.2/kubernetes-client-linux- ...
  • 一 創建CA證書和密鑰 1.1 安裝cfssl工具集 1 [root@k8smaster01 ~]# mkdir -p /opt/k8s/cert 2 3 [root@k8smaster01 ~]# curl -L https://pkg.cfssl.org/R1.2/cfssl_linux-amd ...
  • 晚上將老伺服器程式從win2008部署在新的雲伺服器win2012上,其實就是複製過去改改配置,啟動時突然報不能綁定到埠號:9194原因:Cannot assign requested address: JVM_Bind。 原因分析 1、首先分析可能是埠占用,輸入netstat -an,發現並沒 ...
  • 前段時間跟大家探討了 Vim 的顏色方案的話題,取得了不錯的反響,大家可以點擊以下鏈接回顧那篇文章: "誰說 Vim 不好用?送你一個五彩斑斕的編輯器!" 今天我們來介紹 Vim 的分屏功能 。 為什麼需要分屏功能?其實需求場合有很多。比如,我現在屏幕很大,但我們的代碼一般是左對齊,右邊很空,這樣我 ...
  • 本文主要記錄了連接到MySQL資料庫時出現的問題以及解決辦法。 問題重現 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...