linux 4.19 ip重組

来源:https://www.cnblogs.com/forwards/p/18279336
-Advertisement-
Play Games

IP重組 ip重組這部分 4.19內核與3.10內核有些差別,4.9.134以後內核中不使用低水位和工作隊列了,同時使用了rhashtable 替代了 hash bucket的概念,在3.10內核中使用1024個hash bucket, 每個bucket中最多存放128個分片隊列,在4.19內核中所 ...


IP重組

ip重組這部分 4.19內核與3.10內核有些差別,4.9.134以後內核中不使用低水位和工作隊列了,同時使用了rhashtable 替代了 hash bucket的概念,在3.10內核中使用1024個hash bucket, 每個bucket中最多存放128個分片隊列,在4.19內核中所有的分片隊列都保存在可動態調整的rhashtable 中,同時不再使用低水位和工作隊列對ip 分片進行回收

4.19內核中,在記憶體中會分配一個reassembly buffer用於IP分片的重組。同時,也定義了一系列的參數用於控制IP分片處理過程:
net.ipv4.ipfrag_high_thresh: 用於IP分片重組的最大記憶體用量(預設為4194304 ,即4Mb)。
net.ipv4.ipfrag_time: IP分片在記憶體中的保留時間(預設30,單位:秒)。
對應上述網路協議棧的內核參數,內核層定義了結構體netns_frags,包含分片重組功能需要的全局控制信息,其定義如下:

struct netns_frags {
struct percpu_counter   mem ____cacheline_aligned_in_smp;
        /* sysctls */
        int                     timeout;
        int                     high_thresh;
        int                     low_thresh;
int			max_dist;
struct inet_frags	*f;
        struct rhashtable       rhashtable ____cacheline_aligned_in_smp;
atomic_long_t		mem ____cacheline_aligned_in_smp;
};

其中rhashtable為分片隊列(inet_frag_queue)所在的hash表,IP分片包在內核中根據IP報頭的4個欄位計算得到一個hash值(key值),每個hash值對應一個分片隊列,在實現分片包重組功能時,IP層需要先緩存收到的所有分片包,等待同一個IP報文的所有分片包都到達後,把它們重組成一個大包再提交給L4(TCP/UDP... ...)協議。
當收到新的ip分片包時,將查找是否存在同一數據包的分片隊列。首先檢查當前記憶體中所有待重組分片包占用的記憶體(frag_mem_limit)是否高於高水位(net.ipv4.ipfrag_high_thresh),如果高於則丟棄分片包;否則接著對接收到的分片包與rhashtable表中緩存的分片隊列進行匹配(即從rhashtable表查找分片隊列)將屬於同一數據包的分片包放在同一個分片隊列中,如果一個數據包的所有分片包都接收完成,那麼將進入數據包的重構流程;如果匹配失敗,說明該分片屬於一個新的數據包,那麼進入分片隊列新建流程。分片隊列的接收查找函數inet_frag_find定義如下:

struct inet_frag_queue *inet_frag_find(struct netns_frags *nf, void *key)
{
    struct inet_frag_queue *fq = NULL, *prev;

     //①高水位判斷
    if (!nf->high_thresh || frag_mem_limit(nf) > nf->high_thresh) 
        return NULL;

    rcu_read_lock();
    prev = rhashtable_lookup(&nf->rhashtable, key, nf->f->rhash_params); //② 查找rhashtable中的分片隊列
    if (!prev)
        fq = inet_frag_create(nf, key, &prev); //③ 創建新分片隊列

    if (prev && !IS_ERR(prev)) {
        fq = prev;
        if (!refcount_inc_not_zero(&fq->refcnt))
            fq = NULL;
    }   
    rcu_read_unlock();
    return fq; 
}

在分片隊列的新建流程中,將從slab中分配一段空間,相應增加分片包占用的記憶體,同時設置定時器(超時時常為30秒)用來檢查重組結果,如果定時器超時未重組成功,該分片包也將丟棄。分片包的新建函數inet_frag_alloc定義如下:

static struct inet_frag_queue *inet_frag_alloc(struct netns_frags *nf,
                                               struct inet_frags *f,
                                               void *arg)
{
        struct inet_frag_queue *q;
       
        q = kmem_cache_zalloc(f->frags_cachep, GFP_ATOMIC);
        if (!q)
                return NULL;
       ... ...
       add_frag_mem_limit(nf, f->qsize);          //①增加分片報文占用記憶體

       setup_timer(&q->timer,                     //②設置超時定時器
f->frag_expire, (unsigned long)q);        
        ... ...
        return q;
}

int ip_defrag(struct net *net, struct sk_buff *skb, u32 user)
{
	... ...

	qp = ip_find(net, ip_hdr(skb), user, vif); //①查找分片隊列
	if (qp) {
... ...
		ret = ip_frag_queue(qp, skb); //②分片隊列入隊操作
    ... ...
		return ret;
	}

	kfree_skb(skb);
	return -ENOMEM;
}

如果一個數據包的所有分片包都已接收,則需將所有分片包整合獲得原始數據包,並將整合後的數據包提交給高層協議。同時,處理與分片包相關的數據結構,譬如更新當前分片包占用的記憶體(frag_mem_limit),停止與分片包相關的定時器等。數據包的重構函數ip_frag_reasm定義如下:

static int ip_frag_reasm(struct ipq *qp, struct sk_buff *skb,
             struct sk_buff *prev_tail, struct net_device *dev)
{
     ... ...
     ipq_kill(qp);                   //①減少分片包引用計數
     ... ...
     sub_frag_mem_limit(qp->q.net,   //②減少分片包占用記憶體
head->truesize);
     ... ...
}

所以,一個分片包的接收通常經歷了查找分片、緩存、重組、釋放等階段,下圖是分片包的接收流程。
image

圖1 4.19分片包接收流程

根據分析,內核中待重組的分片包占用記憶體量由高水位(net.ipv4.ipfrag_high_thresh)閾值和分片保留時間(net.ipv4.ipfrag_time)來控制,如果待重組分片包記憶體占用高於高水位(high_thresh),那麼新收到的數據包分片將會直接丟棄, 如果分片包超過最大保留時間(ipfrag_time),那麼已經收到的數據包也會被丟棄。

附3.10 ip重組

image

本文來自博客園,作者:StepForwards,轉載請註明原文鏈接:https://www.cnblogs.com/forwards/p/18279336


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • @目錄一. 編譯系統1.設置交叉編譯工具鏈2.編譯系統二. QT下載1.安裝 Qtcreator2.創建第一個程式3.配置 QtCreator 開發環境4.移植QT程式到開發板 一. 編譯系統 1.設置交叉編譯工具鏈 export ARCH=arm export CROSS_COMPILE=arm- ...
  • 本文詳細介紹瞭如何在 CentOS 伺服器上通過 Docker 安裝和配置迅雷NAS,實現高效的遠程下載功能,並提供了詳細的命令和配置步驟。 ...
  • 第九章 列印輸出實驗 1)實驗平臺:正點原子DNK210開發板 2)章節摘自【正點原子】DNK210使用指南 - CanMV版 V1.0 3)購買鏈接:https://detail.tmall.com/item.htm?&id=782801398750 4)全套實驗源碼+手冊+視頻下載地址:http ...
  • 作者:小牛呼嚕嚕 大家好,我是呼嚕嚕,由於x86保護模式是比較複雜晦澀的,所以特地單拉出來,實模式和保護模式一個重要的更新就是對記憶體的管理與保護,並且隨著軟體的發展,為了極致地壓榨CPU的性能,硬體和軟體都做出了許多努力,為了更好的管理記憶體,引入分段,分頁,段頁等等。本文會沿著記憶體的主線,穿插於實模 ...
  • 第八章 CanMV IDE初體驗 1)實驗平臺:正點原子DNK210開發板 2) 章節摘自【正點原子】DNK210使用指南 - CanMV版 V1.0 3)購買鏈接:https://detail.tmall.com/item.htm?&id=782801398750 4)全套實驗源碼+手冊+視頻下載 ...
  • 最近有個項目需要遠距離讀uart 串口列印出來的數據, 但是淘寶的調試助手太貴了, 開源平臺找了圈也許是因為功能太簡單, 好像沒怎麼找到或者說連接配置的方式很麻煩, 所以我花了半天時間寫了一個.如果有同樣需求的小白可以直接用這個程式跑 本方案主要是 把esp32配置成AP模式. 並且通過TCP/UD ...
  • vim的三種模式 一般模式 以vim打開一個文件就直接進入一般模式了。在這個模式中,你可以使用h,j,k,l按鍵移動游標,也可以使用刪除字元或刪除整行來處理文件內容,也可以使用複製粘貼處理文件內容。 編輯模式 在一般模式中按下A,a,I,i,O,o,R,r任何一個按鍵,就可以進入編輯模式,在界面左下 ...
  • 導航 0 前言 1 許可權匹配流程 2 五種身份變化 3 有效用戶/組 4 特權對 Shell 腳本無效 5 Sudo 與 SUID/SGID 的優先順序 6 SUID、SGID、Sticky 各自的功能 0、前言 Linux最優秀的地方之一,就在於他的多人多工環境。而為了讓各個使用者具有較保密的檔案資 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...