linux 4.19 ip重組

来源:https://www.cnblogs.com/forwards/p/18279336
-Advertisement-
Play Games

IP重組 ip重組這部分 4.19內核與3.10內核有些差別,4.9.134以後內核中不使用低水位和工作隊列了,同時使用了rhashtable 替代了 hash bucket的概念,在3.10內核中使用1024個hash bucket, 每個bucket中最多存放128個分片隊列,在4.19內核中所 ...


IP重組

ip重組這部分 4.19內核與3.10內核有些差別,4.9.134以後內核中不使用低水位和工作隊列了,同時使用了rhashtable 替代了 hash bucket的概念,在3.10內核中使用1024個hash bucket, 每個bucket中最多存放128個分片隊列,在4.19內核中所有的分片隊列都保存在可動態調整的rhashtable 中,同時不再使用低水位和工作隊列對ip 分片進行回收

4.19內核中,在記憶體中會分配一個reassembly buffer用於IP分片的重組。同時,也定義了一系列的參數用於控制IP分片處理過程:
net.ipv4.ipfrag_high_thresh: 用於IP分片重組的最大記憶體用量(預設為4194304 ,即4Mb)。
net.ipv4.ipfrag_time: IP分片在記憶體中的保留時間(預設30,單位:秒)。
對應上述網路協議棧的內核參數,內核層定義了結構體netns_frags,包含分片重組功能需要的全局控制信息,其定義如下:

struct netns_frags {
struct percpu_counter   mem ____cacheline_aligned_in_smp;
        /* sysctls */
        int                     timeout;
        int                     high_thresh;
        int                     low_thresh;
int			max_dist;
struct inet_frags	*f;
        struct rhashtable       rhashtable ____cacheline_aligned_in_smp;
atomic_long_t		mem ____cacheline_aligned_in_smp;
};

其中rhashtable為分片隊列(inet_frag_queue)所在的hash表,IP分片包在內核中根據IP報頭的4個欄位計算得到一個hash值(key值),每個hash值對應一個分片隊列,在實現分片包重組功能時,IP層需要先緩存收到的所有分片包,等待同一個IP報文的所有分片包都到達後,把它們重組成一個大包再提交給L4(TCP/UDP... ...)協議。
當收到新的ip分片包時,將查找是否存在同一數據包的分片隊列。首先檢查當前記憶體中所有待重組分片包占用的記憶體(frag_mem_limit)是否高於高水位(net.ipv4.ipfrag_high_thresh),如果高於則丟棄分片包;否則接著對接收到的分片包與rhashtable表中緩存的分片隊列進行匹配(即從rhashtable表查找分片隊列)將屬於同一數據包的分片包放在同一個分片隊列中,如果一個數據包的所有分片包都接收完成,那麼將進入數據包的重構流程;如果匹配失敗,說明該分片屬於一個新的數據包,那麼進入分片隊列新建流程。分片隊列的接收查找函數inet_frag_find定義如下:

struct inet_frag_queue *inet_frag_find(struct netns_frags *nf, void *key)
{
    struct inet_frag_queue *fq = NULL, *prev;

     //①高水位判斷
    if (!nf->high_thresh || frag_mem_limit(nf) > nf->high_thresh) 
        return NULL;

    rcu_read_lock();
    prev = rhashtable_lookup(&nf->rhashtable, key, nf->f->rhash_params); //② 查找rhashtable中的分片隊列
    if (!prev)
        fq = inet_frag_create(nf, key, &prev); //③ 創建新分片隊列

    if (prev && !IS_ERR(prev)) {
        fq = prev;
        if (!refcount_inc_not_zero(&fq->refcnt))
            fq = NULL;
    }   
    rcu_read_unlock();
    return fq; 
}

在分片隊列的新建流程中,將從slab中分配一段空間,相應增加分片包占用的記憶體,同時設置定時器(超時時常為30秒)用來檢查重組結果,如果定時器超時未重組成功,該分片包也將丟棄。分片包的新建函數inet_frag_alloc定義如下:

static struct inet_frag_queue *inet_frag_alloc(struct netns_frags *nf,
                                               struct inet_frags *f,
                                               void *arg)
{
        struct inet_frag_queue *q;
       
        q = kmem_cache_zalloc(f->frags_cachep, GFP_ATOMIC);
        if (!q)
                return NULL;
       ... ...
       add_frag_mem_limit(nf, f->qsize);          //①增加分片報文占用記憶體

       setup_timer(&q->timer,                     //②設置超時定時器
f->frag_expire, (unsigned long)q);        
        ... ...
        return q;
}

int ip_defrag(struct net *net, struct sk_buff *skb, u32 user)
{
	... ...

	qp = ip_find(net, ip_hdr(skb), user, vif); //①查找分片隊列
	if (qp) {
... ...
		ret = ip_frag_queue(qp, skb); //②分片隊列入隊操作
    ... ...
		return ret;
	}

	kfree_skb(skb);
	return -ENOMEM;
}

如果一個數據包的所有分片包都已接收,則需將所有分片包整合獲得原始數據包,並將整合後的數據包提交給高層協議。同時,處理與分片包相關的數據結構,譬如更新當前分片包占用的記憶體(frag_mem_limit),停止與分片包相關的定時器等。數據包的重構函數ip_frag_reasm定義如下:

static int ip_frag_reasm(struct ipq *qp, struct sk_buff *skb,
             struct sk_buff *prev_tail, struct net_device *dev)
{
     ... ...
     ipq_kill(qp);                   //①減少分片包引用計數
     ... ...
     sub_frag_mem_limit(qp->q.net,   //②減少分片包占用記憶體
head->truesize);
     ... ...
}

所以,一個分片包的接收通常經歷了查找分片、緩存、重組、釋放等階段,下圖是分片包的接收流程。
image

圖1 4.19分片包接收流程

根據分析,內核中待重組的分片包占用記憶體量由高水位(net.ipv4.ipfrag_high_thresh)閾值和分片保留時間(net.ipv4.ipfrag_time)來控制,如果待重組分片包記憶體占用高於高水位(high_thresh),那麼新收到的數據包分片將會直接丟棄, 如果分片包超過最大保留時間(ipfrag_time),那麼已經收到的數據包也會被丟棄。

附3.10 ip重組

image

本文來自博客園,作者:StepForwards,轉載請註明原文鏈接:https://www.cnblogs.com/forwards/p/18279336


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • @目錄一. 編譯系統1.設置交叉編譯工具鏈2.編譯系統二. QT下載1.安裝 Qtcreator2.創建第一個程式3.配置 QtCreator 開發環境4.移植QT程式到開發板 一. 編譯系統 1.設置交叉編譯工具鏈 export ARCH=arm export CROSS_COMPILE=arm- ...
  • 本文詳細介紹瞭如何在 CentOS 伺服器上通過 Docker 安裝和配置迅雷NAS,實現高效的遠程下載功能,並提供了詳細的命令和配置步驟。 ...
  • 第九章 列印輸出實驗 1)實驗平臺:正點原子DNK210開發板 2)章節摘自【正點原子】DNK210使用指南 - CanMV版 V1.0 3)購買鏈接:https://detail.tmall.com/item.htm?&id=782801398750 4)全套實驗源碼+手冊+視頻下載地址:http ...
  • 作者:小牛呼嚕嚕 大家好,我是呼嚕嚕,由於x86保護模式是比較複雜晦澀的,所以特地單拉出來,實模式和保護模式一個重要的更新就是對記憶體的管理與保護,並且隨著軟體的發展,為了極致地壓榨CPU的性能,硬體和軟體都做出了許多努力,為了更好的管理記憶體,引入分段,分頁,段頁等等。本文會沿著記憶體的主線,穿插於實模 ...
  • 第八章 CanMV IDE初體驗 1)實驗平臺:正點原子DNK210開發板 2) 章節摘自【正點原子】DNK210使用指南 - CanMV版 V1.0 3)購買鏈接:https://detail.tmall.com/item.htm?&id=782801398750 4)全套實驗源碼+手冊+視頻下載 ...
  • 最近有個項目需要遠距離讀uart 串口列印出來的數據, 但是淘寶的調試助手太貴了, 開源平臺找了圈也許是因為功能太簡單, 好像沒怎麼找到或者說連接配置的方式很麻煩, 所以我花了半天時間寫了一個.如果有同樣需求的小白可以直接用這個程式跑 本方案主要是 把esp32配置成AP模式. 並且通過TCP/UD ...
  • vim的三種模式 一般模式 以vim打開一個文件就直接進入一般模式了。在這個模式中,你可以使用h,j,k,l按鍵移動游標,也可以使用刪除字元或刪除整行來處理文件內容,也可以使用複製粘貼處理文件內容。 編輯模式 在一般模式中按下A,a,I,i,O,o,R,r任何一個按鍵,就可以進入編輯模式,在界面左下 ...
  • 導航 0 前言 1 許可權匹配流程 2 五種身份變化 3 有效用戶/組 4 特權對 Shell 腳本無效 5 Sudo 與 SUID/SGID 的優先順序 6 SUID、SGID、Sticky 各自的功能 0、前言 Linux最優秀的地方之一,就在於他的多人多工環境。而為了讓各個使用者具有較保密的檔案資 ...
一周排行
    -Advertisement-
    Play Games
  • 通過WPF的按鈕、文本輸入框實現了一個簡單的SpinBox數字輸入用戶組件並可以通過數據綁定數值和步長。本文中介紹了通過Xaml代碼實現自定義組件的佈局,依賴屬性的定義和使用等知識點。 ...
  • 以前,我看到一個朋友在對一個系統做初始化的時候,通過一組魔幻般的按鍵,調出來一個隱藏的系統設置界面,這個界面在常規的菜單或者工具欄是看不到的,因為它是一個後臺設置的關鍵界面,不公開,同時避免常規用戶的誤操作,它是作為一個超級管理員的入口功能,這個是很不錯的思路。其實Winform做這樣的處理也是很容... ...
  • 一:背景 1. 講故事 前些天有位朋友找到我,說他的程式每次關閉時就會自動崩潰,一直找不到原因讓我幫忙看一下怎麼回事,這位朋友應該是第二次找我了,分析了下 dump 還是挺經典的,拿出來給大家分享一下吧。 二:WinDbg 分析 1. 為什麼會崩潰 找崩潰原因比較簡單,用 !analyze -v 命 ...
  • 在一些報表模塊中,需要我們根據用戶操作的名稱,來動態根據人員姓名,更新報表的簽名圖片,也就是電子手寫簽名效果,本篇隨筆介紹一下使用FastReport報表動態更新人員簽名圖片。 ...
  • 最新內容優先發佈於個人博客:小虎技術分享站,隨後逐步搬運到博客園。 創作不易,如果覺得有用請在Github上為博主點亮一顆小星星吧! 博主開始學習編程於11年前,年少時還只會使用cin 和cout ,給單片機點點燈。那時候,類似async/await 和future/promise 模型的認知還不是 ...
  • 之前在阿裡雲ECS 99元/年的活動實例上搭建了一個測試用的MINIO服務,以前都是直接當基礎設施來使用的,這次準備自己學一下S3相容API相關的對象存儲開發,因此有了這個小工具。目前僅包含上傳功能,後續計劃開發一個類似圖床的對象存儲應用。 ...
  • 目錄簡介快速入門安裝 NuGet 包實體類User資料庫類DbFactory增刪改查InsertSelectUpdateDelete總結 簡介 NPoco 是 PetaPoco 的一個分支,具有一些額外的功能,截至現在 github 星數 839。NPoco 中文資料沒多少,我是被博客園群友推薦的, ...
  • 前言 前面使用 Admin.Core 的代碼生成器生成了通用代碼生成器的基礎模塊 分組,模板,項目,項目模型,項目欄位的基礎功能,本篇繼續完善,實現最核心的模板生成功能,並提供生成預覽及代碼文件壓縮下載 準備 首先清楚幾個模塊的關係,如何使用,簡單畫一個流程圖 前面完成了基礎的模板組,模板管理,項目 ...
  • 假設需要實現一個圖標和文本結合的按鈕 ,普通做法是 直接重寫該按鈕的模板; 如果想作為通用的呢? 兩種做法: 附加屬性 自定義控制項 推薦使用附加屬性的形式 第一種:附加屬性 創建Button的附加屬性 ButtonExtensions 1 public static class ButtonExte ...
  • 在C#中,委托是一種引用類型的數據類型,允許我們封裝方法的引用。通過使用委托,我們可以將方法作為參數傳遞給其他方法,或者將多個方法組合在一起,從而實現更靈活的編程模式。委托類似於函數指針,但提供了類型安全和垃圾回收等現代語言特性。 基本概念 定義委托 定義委托需要指定它所代表的方法的原型,包括返回類 ...