我們來說一說TCP神奇的40ms

来源:https://www.cnblogs.com/qcloud1001/archive/2018/12/24/10170254.html
-Advertisement-
Play Games

本文由雲+社區發表 TCP是一個複雜的協議,每個機制在帶來優勢的同時也會引入其他的問題。 Nagel演算法和delay ack機制是減少發送端和接收端包量的兩個機制, 可以有效減少網路包量,避免擁塞。但是,在特定場景下, Nagel演算法要求網路中只有一個未確認的包, 而delay ack機制需要等待更 ...


本文由雲+社區發表

TCP是一個複雜的協議,每個機制在帶來優勢的同時也會引入其他的問題。 Nagel演算法和delay ack機制是減少發送端和接收端包量的兩個機制, 可以有效減少網路包量,避免擁塞。但是,在特定場景下, Nagel演算法要求網路中只有一個未確認的包, 而delay ack機制需要等待更多的數據包, 再發送ACK回包, 導致發送和接收端等待對方發送數據, 造成死鎖, 只有當delay ack超時後才能解開死鎖,進而導致應用側對外的延時高。 其他文字已經介紹了相關的機制, 已經有一些文章介紹這種時延的場景。本文結合具體的tcpdump包,分析觸發delay ack的場景,相關的內核參數, 以及規避的方案。

背景

給redis加了一個proxy層, 壓測的時候發現, 對寫入命令,數據長度大於2k後, 性能下降非常明顯, 只有直連redis-server的1/10. 而get請求影響並不是那麼明顯。

img

分析

觀察系統的負載和網路包量情況, 都比較低, 網路包量也比較小, proxy內部的耗時也比較短。 無賴只能祭出tcpdump神奇, 果然有妖邪。

img

22號tcp請求包, 42ms後服務端才返回了ack。 初步懷疑是網路層的延時導致了耗時增加。Google和km上找資料, 大概的解釋是這樣: 由於客戶端打開了Nagel演算法, 服務端未關閉延遲ack, 會導致延遲ack超時後,再發送ack,引起超時。

原理

Nagel演算法,轉自維基百科

if there is new data to send

  if the window size >= MSS and available data is >= MSS

    send complete MSS segment now

  else

    if there is unconfirmed data still in the pipe

      enqueue data in the buffer until an acknowledge is received

    else

      send data immediately

    end if

  end if

end if

簡單講, Nagel演算法的規則是:

  1. 如果發送內容大於1個MSS, 立即發送;
  2. 如果之前沒有包未被確認, 立即發送;
  3. 如果之前有包未被確認, 緩存發送內容;
  4. 如果收到ack, 立即發送緩存的內容。

延遲ACK的源碼如下:net/ipv4/tcp_input.c

img

基本原理是:

  1. 如果收到的數據內容大於一個MSS, 發送ACK;
  2. 如果收到了接收視窗以為的數據, 發送ACK;
  3. 如果處於quick mode, 發送ACK;
  4. 如果收到亂序的數據, 發送ACK;
  5. 其他, 延遲發送ACK

其他都比較明確, quick mode是怎麼判斷的呢? 繼續往下看代碼:

img

影響quick mode的一個因素是 ping pong的狀態。 Pingpong是一個狀態值, 用來標識當前tcp交互的狀態, 以預測是否是W-R-W-R-W-R這種互動式的通訊模式, 如果處於, 可以用延遲ack, 利用Read的回包, 將Write的回包, 捎帶給發送方。

img

如上圖所示, 預設pingpong = 0, 表示非互動式的, 服務端收到數據後, 立即返回ACK, 當服務端有數據響應時,服務端將pingpong = 1, 以後的交互中, 服務端不會立即返回ack,而是等待有數據或者ACK超時後響應。

問題

按照前面的的原理分析,應該每次都有ACK延遲的,為什麼我們測試小於2K的數據時, 性能並沒有受到影響呢?

繼續分析tcpdump包:

img

按照Nagel演算法和延遲ACK機制, 上面的交互如下圖所示, 由於每次發生的數據都包含了完整的請求, 服務端處理完成後, 向客戶端返回命令響應時, 將請求的ACK捎帶給客戶端,節約一次網路包。

img

再分析2K的場景:

img

如下表所示, 第22個包發送的數據小於MSS, 同時,pingpong = 1, 被認為是交互模式, 期待通過捎帶ACK的方式來減少網路的包量。 但是, 服務端收到的數據,並不是一個完整的包,不能產生一次應答。服務端只能在等待40ms超時後,發送ACK響應包。

同時,從客戶端來看,如果在發送一個包, 也可以打破已收數據 > MSS的限制。 但是,客戶端受Nagel演算法的限制, 一次只能有一個包未被確認,其他的數據只能被緩存起來, 等待發送。

img

觸發場景

一次tcp請求的數據, 不能在服務端產生一次響應,或者小於一個MSS

規避方案

只有同時客戶端打開Nagel演算法, 服務端打開tcp_delay_ack才會導致前面的死鎖狀態。 解決方案可以從TCP的兩端來入手。

服務端:

  1. 關閉tcp_delay_ack, 這樣, 每個tcp請求包都會有一個ack及時響應, 不會出現延遲的情況。 操作方式: echo 1 > /proc/sys/net/ipv4/tcp_no_delay_ack 但是, 每個tcp請求都返回一個ack包, 導致網路包量的增加,關閉tcp延遲確認後, 網路包量大概增加了80%,在高峰期影響還是比較明顯。

img

2.設置TCP_QUICKACK屬性。 但是需要每次recv後再設置一次。 對應我們的場景不太適合,需要修改服務端redis源碼。

客戶端:

  1. 關閉nagel演算法,即設置socket tcp_no_delay屬性。static void _set_tcp_nodelay(int fd) { int enable = 1; setsockopt(fd, IPPROTO_TCP, TCP_NODELAY, (void*)&enable, sizeof(enable)); }
  2. 避免多次寫, 再讀取的場景, 合併成一個大包的寫;避免一次請求分成多個包發送, 最開始發送的包小於一個MSS,對我們的場景, 把第22號包的1424個位元組緩存起來, 大於一個MSS的時候,再發送出去, 服務端立即返迴響應, 客戶端繼續發送後續的數據, 完成交互,避免時延。

此文已由作者授權騰訊雲+社區發佈



您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • C# -- 泛型的使用 1. 使用泛型 運行結果: 2. 泛型約束 運行結果: ...
  • Ssh登錄 Ssh是建立在應用層和傳輸層的安全協議,專門為遠程登錄回話和其他網路服務提供安全性。利用ssh可以有效的防止遠程管理中的信息泄露問題,同時ssh傳輸的數據是經過壓縮的,可以加快傳輸速度。 1、啟動sshd服務。Centos預設已經安裝了ssh,而且該服務預設是啟動的 [root@loca ...
  • 一 環境準備 1.1 Flannel概述 Flannel是一種基於overlay網路的跨主機容器網路解決方案,即將TCP數據包封裝在另一種網路包裡面進行路由轉發和通信,Flannel是CoreOS開發,專門用於docker多機互聯的一個工具,讓集群中的不同節點主機創建的容器都具有全集群唯一的虛擬ip ...
  • Mysql安裝和使用:點我有驚喜 ...
  • 環境 操作系統版本:Win7旗艦版64位系統 1、安裝FTP組件 ,打開過程可能會比較慢,大概3、4分鐘: 。勾選Internet信息服務下的 、`FTP服務 FTP擴展性 Web管理工具`全部項,如下圖: 2、添加FTP站點 在開始 程式中找到 ,並打開 右擊“網站”,選擇 : 在站點信息中,名稱 ...
  • 一 Docker Compose概述 Compose是一個用於定義和運行多容器Docker應用程式的工具。使用Compose,您可以使用YAML文件來配置應用程式的服務。然後,使用單個命令,您可以從配置中創建並啟動所有服務。 Compose適用於所有環境:生產,登臺,開發,測試以及CI工作流程。 使 ...
  • Linux seq_printf輸出內容不完整的問題 寫在前面的話:這是多年前在項目中遇到的問題,作為博客的開篇之作,有不足之處,請各位大俠斧正!謝謝! seq_file介面介紹 有許多種方法能夠實現設備驅動(或其它內核組件)提供信息給用戶或系統管理員。一個有用的技術是在debugfs,/proc或 ...
  • 當你初次創建新的 Centos 伺服器的時候, Centos 預設的配置安全性和可用性上會存在一點缺陷(運維人員往往會有初始化的腳本)。為了增強伺服器的安全性和可用性,有些配置你應該儘快地完成。 這篇文章大致從這方面去講 - 賬號安全 - ssh 安全 - 防火牆 - 交換區文件(swap file... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...