Linux2.6內核協議棧系列--TCP協議1.發送

来源:http://www.cnblogs.com/joey-hua/archive/2016/09/24/5899471.html
-Advertisement-
Play Games

在介紹tcp發送函數之前得先介紹很關鍵的一個結構sk_buff,在linux中,sk_buff結構代表了一個報文: 然後見發送函數源碼,這裡不關註硬體支持的分散-聚集: 詳細的說明見註釋。 註意幾點主要的流程: 1.TCP以1mss為單元來發送數據,最大段大小基於MTU計算獲得,MTU是一個鏈路層的 ...


在介紹tcp發送函數之前得先介紹很關鍵的一個結構sk_buff,在linux中,sk_buff結構代表了一個報文:

然後見發送函數源碼,這裡不關註硬體支持的分散-聚集:

/* sendmsg系統調用在TCP層的實現 */
int tcp_sendmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg,
		size_t size)
{
	struct iovec *iov;
	struct tcp_sock *tp = tcp_sk(sk);
	struct sk_buff *skb;/*一個報文*/
	int iovlen, flags;
	int mss_now;
	int err, copied;
	long timeo;

	/* 獲取套介面的鎖 */
	lock_sock(sk);
	TCP_CHECK_TIMER(sk);

	/* 根據標誌計算阻塞超時時間 */
	flags = msg->msg_flags;
	timeo = sock_sndtimeo(sk, flags & MSG_DONTWAIT);

	/* Wait for a connection to finish. */
	if ((1 << sk->sk_state) & ~(TCPF_ESTABLISHED | TCPF_CLOSE_WAIT))/* 只有這兩種狀態才能發送消息 */
		if ((err = sk_stream_wait_connect(sk, &timeo)) != 0)/* 其它狀態下等待連接正確建立,超時則進行錯誤處理 */
			goto out_err;

	/* This should be in poll */
	clear_bit(SOCK_ASYNC_NOSPACE, &sk->sk_socket->flags);

	/* 獲得有效的MSS,如果支持OOB,則不能支持TSO,MSS則應當是比較小的值 */
	mss_now = tcp_current_mss(sk, !(flags&MSG_OOB));

	/* Ok commence sending. */
	/* 獲取待發送緩衝區數組指針及其長度 */
	iovlen = msg->msg_iovlen;
	iov = msg->msg_iov;
	/* copied表示從用戶數據塊複製到skb中的位元組數。 */
	copied = 0;

	err = -EPIPE;
	/* 如果套介面存在錯誤,則不允許發送數據,返回EPIPE錯誤 */
	if (sk->sk_err || (sk->sk_shutdown & SEND_SHUTDOWN))
		goto do_error;

	while (--iovlen >= 0) {/* 處理所有待發送數據塊 */
		/*要分段緩衝區的指針和長度*/
		int seglen = iov->iov_len;
		unsigned char __user *from = iov->iov_base;

		iov++;

		while (seglen > 0) {/* 處理單個數據塊中的所有數據 */
			int copy;
			/*取傳輸隊列的上一個sk_buff指針,這下麵一小段的目的是檢查
			傳輸隊列是否有未滿段,未滿段是當前分段長度小於1mss。只有
			當現有分段滿負荷時,才能生成新的數據分段*/
			skb = sk->sk_write_queue.prev;

			/*隊列是一個雙向鏈表,通過隊列頭的prev來訪問套接字最後一個分段。
			首先檢查傳輸隊列頭是否有數據分段,如果該值是NULL,就沒必要
			檢查未滿分段。*/
			if (!sk->sk_send_head ||/* 發送隊列為空,前面取得的skb無效 */
				/* 如果skb有效,但是它已經沒有多餘的空間複製新數據了 */
			    (copy = mss_now - skb->len) <= 0) {
/*為用戶數據創建一個新的分段*/
new_segment:
				/* 發送隊列中數據長度達到發送緩衝區的上限,等待緩衝區 */
				if (!sk_stream_memory_free(sk))
					goto wait_for_sndbuf;

				/*如果有足夠的記憶體,就為TCP數據分段分配新緩衝區。如果硬體
				支持分散-聚集技術,就分配一個數據頁大小的緩衝區。否則就
				分配大小為1mss的緩衝區。*/
				skb = sk_stream_alloc_pskb(sk, select_size(sk, tp),
							   0, sk->sk_allocation);/* 分配新的skb */
				/* 分配失敗,說明系統記憶體不足,等待記憶體釋放 */
				if (!skb)
					goto wait_for_memory;

				/* 根據路由網路設備的特性,確定是否由硬體執行校驗和 */
				if (sk->sk_route_caps &
				    (NETIF_F_IP_CSUM | NETIF_F_NO_CSUM |
				     NETIF_F_HW_CSUM))
					skb->ip_summed = CHECKSUM_HW;

				skb_entail(sk, tp, skb);/* 將SKB新分段添加到發送隊列尾部 */
				copy = mss_now;/* 本次需要複製的數據量是MSS */
			}

			/* 要複製的數據長度copy不能大於當前段剩餘的長度,
			seglen的減法在下麵。*/
			if (copy > seglen)
				copy = seglen;

			/* skb線性存儲區底部還有空間 */
			if (skb_tailroom(skb) > 0) {
				/* 本次只複製skb存儲區底部剩餘空間大小的數據量 */
				if (copy > skb_tailroom(skb))
					copy = skb_tailroom(skb);
				/* 從用戶空間複製指定長度的數據到skb中,如果失敗,則退出 */
				if ((err = skb_add_data(skb, from, copy)) != 0)
					goto do_fault;
			} 
			/* 線性存儲區底部已經沒有空間了,複製到分散/聚集存儲區中 */
			else {
                        ...//忽略
                        }

			if (!copied)/* 如果沒有複製數據,則取消PSH標誌 */
				TCP_SKB_CB(skb)->flags &= ~TCPCB_FLAG_PSH;



			/* 更新發送隊列最後一個包的序號 */
			tp->write_seq += copy;
			/* 更新當前數據分段skb的結尾序號,以使其能夠包括當前段所
			覆蓋的全部序列。*/
			TCP_SKB_CB(skb)->end_seq += copy;
			skb_shinfo(skb)->tso_segs = 0;

			/* 更新數據複製的指針,使其指向下一個要複製的數據起始位置,
			然後更新要複製的位元組數。*/
			from += copy;
			copied += copy;
			/* 如果所有數據已經複製完畢則退出,會調用tcp_push()將傳輸
			隊列中的數據分段發送出去。*/
			if ((seglen -= copy) == 0 && iovlen == 0)
				goto out;

			/* 走到這裡說明還沒有將全部用戶緩衝區複製到套接字緩衝區,就檢查
			如果當前skb中的數據小於mss,說明可以往裡面繼續複製數據。
			或者發送的是OOB數據,則也跳過發送過程,繼續複製數據 */
			if (skb->len != mss_now || (flags & MSG_OOB))
				continue;

			/* 走到這裡說明當前數據段已滿。就調用foced_push()來檢查是否為
			傳輸隊列中的最後一個分段設置了強制push標誌。如果設置了強制push
			標誌,需要告訴接收端應用程式首先處理該數據。
			必須立即發送數據,即上次發送後產生的數據已經超過通告視窗值的一半 */
			if (forced_push(tp)) {
				/* 設置PSH標誌後發送數據 */
				tcp_mark_push(tp, skb);
				/*然後根據Nagle演算法、擁塞視窗、發送視窗調用此函數來啟動
				待發送分段的傳輸。*/
				__tcp_push_pending_frames(sk, tp, mss_now, TCP_NAGLE_PUSH);
			} 
			/* 雖然不是必鬚髮送數據,但是發送隊列上只存在當前段,也將其發送出去 */
			/*如果不能強制push該數據,並且傳輸隊列中僅有一個數據段,就調用
			tcp_push_one()來將該數據段push到傳輸隊列中。*/
			else if (skb == sk->sk_send_head)
				tcp_push_one(sk, mss_now);
			/*然後在內部迴圈迭代中對剩餘的數據進行分段處理。*/
			continue;

wait_for_sndbuf:
			/* 由於發送隊列滿的原因導致等待 */
			set_bit(SOCK_NOSPACE, &sk->sk_socket->flags);
wait_for_memory:
			if (copied)/* 雖然沒有記憶體了,但是本次調用複製了數據到緩衝區,調用tcp_push將其發送出去 */
				tcp_push(sk, tp, flags & ~MSG_MORE, mss_now, TCP_NAGLE_PUSH);

			/* 等待記憶體可用 */
			if ((err = sk_stream_wait_memory(sk, &timeo)) != 0)
				goto do_error;/* 確實沒有記憶體了,超時後返回失敗 */

			/* 睡眠後,MSS可能發生了變化,重新計算 */
			mss_now = tcp_current_mss(sk, !(flags&MSG_OOB));
		}
	}

out:
	if (copied)/* 從用戶態複製了數據,發送它 */
		tcp_push(sk, tp, flags, mss_now, tp->nonagle);
	TCP_CHECK_TIMER(sk);
	release_sock(sk);/* 釋放鎖以後返回 */
	return copied;

do_fault:
	if (!skb->len) {/* 複製數據失敗了,如果skb長度為0,說明是新分配的,釋放它 */
		if (sk->sk_send_head == skb)/* 如果skb是發送隊列頭,則清空隊列頭 */
			sk->sk_send_head = NULL;
		__skb_unlink(skb, skb->list);
		sk_stream_free_skb(sk, skb);/* 釋放skb */
	}

do_error:
	if (copied)
		goto out;
out_err:
	err = sk_stream_error(sk, flags, err);
	TCP_CHECK_TIMER(sk);
	release_sock(sk);
	return err;
}

詳細的說明見註釋。

註意幾點主要的流程:

1.TCP以1mss為單元來發送數據,最大段大小基於MTU計算獲得,MTU是一個鏈路層的特征參數,並且可以從tcp_current_mss()獲取。

2.sk_stream_alloc_pskb()為TCP數據分配一個新的緩衝區,它的最小長度是1mss。

3.skb_entail()將報文發往傳輸緩存區排隊,並計算已分配的緩衝區記憶體。

4.tcp_push_one()負責傳輸寫隊列中的一個數據段。__tcp_push_pending_frames()負責傳輸在寫隊列中排隊的多個數據段。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • <ul id="ul1"> <li></li> <li></li> </ul> window.onload = function(){ var aLi = document.getElementsByTagName("li"); // var page = 1; //有了頁碼寫進去 var togg ...
  • JavaScript是ECMAScript的實現和擴展,ES6標準的制定也為JavaScript加入了許多新特性。本文主要記錄展開運算符。 展開運算符(spread operator)允許一個表達式在某處展開。展開運算符在多個參數(用於函數調用)或多個元素(用於數組字面量)或者多個變數(用於解構賦值 ...
  • 1. width:0; 光有高度是不行的,還得有寬度。缺點文字隱藏不了,可以加個 和背景顏色一樣就ok了,障眼法,迷惑人的,其實內容還在,如果有文字的話,還是可以觸發點擊事件的,這種做法很多黑客就會利用在目標站點鏈接上加一個和背景顏色一樣的讓管理員發現不了。 2. height:0; 和上面一樣,一 ...
  • 前幾天在院子里看了一個大牛用js寫了一個路由的,有一句代碼一直不知道怎麼回事,後來就自己寫了一個,寫的比較的粗糙,我覺得把面向對象的思想都搞得亂七八糟的,不過功能實現了. ...
  • 本文地址:http://www.cnblogs.com/wuyudong/p/5904528.html,轉載請註明源地址。 本文對之前手機衛士開發進行一個小結。 1、SplashActivity 版本名稱的展示,從清單配置文件中獲取版本名稱,PackageManager 服務端新版本的檢測(本地版本 ...
  • 文本框(UITextField) 本章節繼續編輯 JXHypnoNerd 。文件地址 。 首先我們繼續編輯 JXHypnosisViewController.m 修改 loadView 方法,向 view 中添加一個 UITextField 對象: 構建並運行應用,項目中會顯示一個文本框,該文本框就 ...
  • 本文地址:http://www.cnblogs.com/wuyudong/p/5903707.html,轉載請註明源地址。 在手機衛士之前的版本升級的對話框中: 有的用戶暫時不想更新,沒有點擊“稍後再說”,而是選擇點擊回退按鍵,那麼這時候的邏輯應該是讓用戶進入home界面而不是splash界面。所以 ...
  • Activity有些公共部分,比如setContentView、Activity管理、初始化操作、聯網操作、Activity跳轉、關閉當前Activity、保存用戶登錄信息、讀取用戶登錄信息等。 我們可以抽取成一個抽象類BaseActivity,再新建Activity的時候,繼承BaseActivi ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...