[20200312]不要設置net.ipv4.tcp_tw_recycle=1.txt

来源:https://www.cnblogs.com/lfree/archive/2020/03/13/12484481.html
-Advertisement-
Play Games

[20200312]不要設置net.ipv4.tcp_tw_recycle=1.txt--//昨天認真看了2篇blog:https://vincent.bernat.ch/en/blog/2014-tcp-time-wait-state-linux--//中文翻譯:http://www.cnxct. ...


[20200312]不要設置net.ipv4.tcp_tw_recycle=1.txt

--//昨天認真看了2篇blog:
https://vincent.bernat.ch/en/blog/2014-tcp-time-wait-state-linux
--//中文翻譯:
http://www.cnxct.com/coping-with-the-tcp-time_wait-state-on-busy-linux-servers-in-chinese-and-dont-enable-tcp_tw_recycle/

--//裡面提到不要設置net.ipv4.tcp_tw_recycle=1。TIME_WAIT狀態問題不是太嚴重,可以完全不理會它。
--//我仔細閱讀,說真的許多一些細節還不是很理解。我開始接觸主要是不理解生產系統rac環境為什麼這麼多state=TIME_WAIT.
--//現在看來自己純粹是畫蛇添足,浪費時間,不過自己感覺還是學到許多東西.

--//現在我大概知道原因,做一些總結:

1.實際上對於正常資料庫應用,正常退出應用程式,實際上state=TIME_WAIT發生在客戶端,這也是我開始的困惑。服務端不應該這個多
  state=TIME_WAIT。我的問題實際上由此展開^_^.

https://vincent.bernat.ch/en/blog/2014-tcp-time-wait-state-linux

TCP state diagram

Only the end closing the connection first will reach the TIME-WAIT state. The other end will follow a path which usually
permits to quickly get rid of the connection.
--//只有先關閉連接的結束才會達到TIME-WAIT狀態.. 另一端將沿著通常允許快速擺脫連接。

2.我們使用dblink短連接很多,這時服務端實際上變成客戶端,導致state=TIME_WAIT多。

3.exadata 出廠設置 net.ipv4.tcp_timestamps = 0,即使我設置net.ipv4.tcp_tw_recycle=1也無效,毫無作用,這也是我在測試中遇
  到的第二個困惑。我想oracle這樣做可能有它的道理, 不會使用特殊的方式規避其它dba設置net.ipv4.tcp_tw_recycle=1的問題。

--//exadate 的 /etc/sysctl.conf設置,不知道前面# 12650500 ,oracle內部表示什麼?
# 12650500
net.ipv4.tcp_timestamps = 0

--//再次提醒建議不要設置net.ipv4.tcp_tw_recycle=1 解決大量state=TIME_WAIT問題。

4.還有1個原因導致服務端state=TIME_WAIT增多,就是客戶端連接RAC資料庫使用scan ip,會跳轉到vip ip,這樣一旦大量用戶以這種方式
  登錄,就是在服務端產生大量的state=TIME_WAIT連接。

5.還有前臺客戶端基本都是XP機器。我的測試MS關於tcp_timestamps預設設置是關閉的,至少在windows 7,windows 2003伺服器版下,XP
  我不知道。
 
這樣即使服務端設置  net.ipv4.tcp_timestamps = 1 和 net.ipv4.tcp_tw_recycle=1 依舊在服務端生產大量的state=TIME_WAIT.
不過linux機器預設設置都是net.ipv4.tcp_timestamps = 1。

--//再次提醒建議不要設置net.ipv4.tcp_tw_recycle=1 解決大量state=TIME_WAIT問題。  
--//註:我在這裡測試時又犯了一個錯誤,以為跨網段的機器不能快速回收TIME_WAIT,實際上是我的測試機器windows7的
--//tcp_timestamps預設設置是關閉的.

6.有一個可行的方法減少大量state=TIME_WAIT連接,就是在一些中間件伺服器可以不要使用scan ip連接資料庫,採用老的vip ip就可以
  減少這樣的情況。改動涉及中間件伺服器,影響不大,這是比較可行成本最低的改進方法,僅僅對rac環境有效.

--//話又反活來講,如果不是rac環境,可能就看不到大量的state=TIME_WAIT狀態.

7.如果網路鏈接通過公網或者NAT轉換,肯定不能設置net.ipv4.tcp_tw_recycle=1. 由於我們一些應用通過公網,當我設置
  net.ipv4.tcp_tw_recycle=1
  net.ipv4.tcp_timestamps=1
--//確實有少量的客戶端(實際上也就2台)無法連接伺服器的情況,甚至內網的機器也出現一臺,我不知道為什麼。最終還原原來設置
  net.ipv4.tcp_tw_recycle=0
  net.ipv4.tcp_timestamps=0

8.記憶體 CPU 資源消耗很少。參考鏈接的測試:https://vincent.bernat.ch/en/blog/2014-tcp-time-wait-state-linux

9.state=TIME_WAIT對應用影響很小,4元素組成一個連接,oracle 建議內核參數設置net.ipv4.ip_local_port_range = 1024 65000
  支持埠數量達到64000,這樣如果不達到每秒60000/60 = 1000 個/連接,基本影響可以忽略。

  我感覺不能達到這個數量,至少我自己沒見過。我們資料庫高峰也就是200個/每秒連接。

10.TIME_WAIT狀態的消失時間在linux下寫死的,在net/tcp.h頭文件裡面的,許多鏈接提示修改net.ipv4.tcp_fin_timeout是錯誤的:
--//除非修改頭文件內容,重新編譯內核!!
#define TCP_TIMEWAIT_LEN (60*HZ) /* how long to wait to destroy TIME-WAIT
                  * state, about 60 seconds */
#define TCP_FIN_TIMEOUT TCP_TIMEWAIT_LEN
                                 /* BSD style FIN_WAIT2 deadlock breaker.
                  * It used to be 3min, new value is 60sec,
                  * to combine FIN-WAIT-2 timeout with
                  * TIME-WAIT timer.
                  */

11.windows下可以修改TIME_WAIT狀態的消失時間:
--//在HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters上添加一個DWORD類型的值TcpTimedWaitDelay,值
--//就是秒數,最小30秒,不能低於該值.註要重啟機器才能生效:
--//timewait.reg
REGEDIT4

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\Tcpip\Parameters]
"TcpTimedWaitDelay"=dword:0000001e

12.windows下設置tcp_timestamps:
--//按照https://docs.microsoft.com/en-us/previous-versions/windows/it-pro/windows-2000-server/cc938205(v=technet.10)?redirectedfrom=MSDN
Tcp1323Opts
--//註:1323 應該是關聯RFC 1323文檔.

HKLM\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters

Data type  Range            Default value
------------------------------------------
REG_DWORD  0 | 1 | 2 | 3    3

Value  Meaning
0 (00) Timestamps and window scaling are disabled.
1 (01) Window scaling is enabled.
2 (10) Timestamps are enabled.
3 (11) Timestamps and window scaling are enabled.

--//按照介紹MS預設應該是打開tcp_timestamps的。不過我發現在windows 7,windows 2003下不是這樣。修改為2或者3.我僅僅測試修改3
--//的情況.
REGEDIT4

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\Tcpip\Parameters]
"Tcp1323Opts"=hex:03

13.最後簡單講一下測試方法,使用tnsping server_ip count > /dev/null,這樣比較簡單快捷,這時state=TIME_WAIT出現在服務端,使用
   netstat -ntop 或者ss -nto 觀察.

# seq 10000 | xargs -IQ bash -c "ss -tano state time-wait | ts.awk ; sleep 1"
or
# seq 10000 | xargs -IQ bash -c "netstat -nto | grep TIME-WAIT | ts.awk ; sleep 1"

$ cat $(which ts.awk)
# /bin/bash
gawk '{ print strftime("[%Y-%m-%d %H:%M:%S]"), $0 }'

在服務端net.ipv4.tcp_tw_recycle=1,net.ipv4.tcp_timestamps=1,客戶端net.ipv4.tcp_timestamps=1的情況下服務端出現TIME_WAIT很快消失.
在服務端net.ipv4.tcp_tw_recycle=1,net.ipv4.tcp_timestamps=1,客戶端net.ipv4.tcp_timestamps=0的情況下服務端出現TIME_WAIT等60秒消失.
在服務端net.ipv4.tcp_tw_recycle=1,net.ipv4.tcp_timestamps=0,                                       服務端出現TIME_WAIT等60秒消失.
在服務端net.ipv4.tcp_tw_recycle=0,net.ipv4.tcp_timestamps=N(N=1,0)                                 服務端出現TIME_WAIT等60秒消失.

--//大家可以自行測試.測試結果就不貼上來了,有點繁瑣.
--//從這裡也看出如果大量的客戶端是windows,沒有打開tcp_timestamp,在服務端設置
--//net.ipv4.tcp_tw_recycle=1,net.ipv4.tcp_timestamps=1也一樣毫無用處.

14.演示一個服務端產生大量TIME_WAIT的例子:
--//還是另外寫一篇,不然寫的又太長了.

--//最後再次提醒建議不要設置net.ipv4.tcp_tw_recycle=1來解決大量state=TIME_WAIT問題,重要的問題說三遍,國內大量的鏈接這樣
--//做可能會導致一些網路故障非常難查,除非應用都是非常純的內網環境裡面。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 學習目的 1. 如何判斷守護進程沒有開啟 2. 啟動和暫停以及重啟 3. 設計開機自啟 守護進程未開啟時 1. , 指令會正常輸出結果 2. , 等一些指令會出現下麵提示 啟動docker守護進程 停止docker守護進程 重啟docker守護進程 restart 實踐上是先運行了stop,然後再運 ...
  • 一、 vnc client 下載 下載地址:https://www.realvnc.com/en/connect/download/viewer/ 有桌面環境,忽略 二、linux安裝桌面環境 無桌面linux伺服器執行 ]# yum groupinstall "GNOME Desktop" "Gr ...
  • 常用分頁查詢sql 先介紹一個面試題,查詢表中第200-300條數據。應用既是分頁查詢,先通過子查詢對數據進行標記,如oracle通過rownum進行標記,再取一個區間的數據。 一,ORACLE 關鍵字 rownum 規則: select * from (select a.*,rownum rc f ...
  • 慢查詢日誌中long_query_time 與log_queries_not_using_indexes與min_examined_row_limit 關係分析 參數介紹: long_query_time:慢查詢日誌記錄超時的時間,無論是不是有索引,單位秒。 log_queries_not_usin ...
  • 第九章 存儲過程 初識存儲過程 存儲過程(Stored Procedure)是在大型資料庫系統中,一組為了完成特定功能的SQL 語句集,存儲在資料庫中,經過第一次編譯後調用不需要再次編譯,用戶通過指定存儲過程的名字並給出參數(如果該存儲過程帶有參數)來執行它。存儲過程是資料庫中的一個重要對象。 包含 ...
  • 目前負責的一個項目,需要維護一個電話號碼對比庫,表名為phone_bak1,以下稱為a表,量級為3000萬條。還有另外一張表存儲電話白名單,表名為phone_delete,以下稱為b表,量級為3000條左右。 目的呢,是要從a表中排除掉在b表中的電話號碼。 我直接使用以下語句: DELETE FRO ...
  • 資料庫版本及優勢 3.4版本在性能和安全性等方面較3.2版本均有不同程度的提升; 4.0版本更適用於金融等對事務有依賴且使用NoSQL特性的場景; 4.2版本採用二段提交方式,保證分片集群事務的ACID特性,極大拓展了適用的業務場景。更多詳情請參見下表。 資料庫版本優勢 3.4版本 更快的主備同步 ...
  • 場景 Centos中Redis的下載編譯與安裝(超詳細): https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/103967334 Redis的啟動和關閉(前臺啟動和後臺啟動): https://blog.csdn.net/BADAO_ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...