Linux2.6內核協議棧系列--TCP協議1.發送

来源:http://www.cnblogs.com/joey-hua/archive/2016/09/24/5899471.html
-Advertisement-
Play Games

在介紹tcp發送函數之前得先介紹很關鍵的一個結構sk_buff,在linux中,sk_buff結構代表了一個報文: 然後見發送函數源碼,這裡不關註硬體支持的分散-聚集: 詳細的說明見註釋。 註意幾點主要的流程: 1.TCP以1mss為單元來發送數據,最大段大小基於MTU計算獲得,MTU是一個鏈路層的 ...


在介紹tcp發送函數之前得先介紹很關鍵的一個結構sk_buff,在linux中,sk_buff結構代表了一個報文:

然後見發送函數源碼,這裡不關註硬體支持的分散-聚集:

/* sendmsg系統調用在TCP層的實現 */
int tcp_sendmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg,
		size_t size)
{
	struct iovec *iov;
	struct tcp_sock *tp = tcp_sk(sk);
	struct sk_buff *skb;/*一個報文*/
	int iovlen, flags;
	int mss_now;
	int err, copied;
	long timeo;

	/* 獲取套介面的鎖 */
	lock_sock(sk);
	TCP_CHECK_TIMER(sk);

	/* 根據標誌計算阻塞超時時間 */
	flags = msg->msg_flags;
	timeo = sock_sndtimeo(sk, flags & MSG_DONTWAIT);

	/* Wait for a connection to finish. */
	if ((1 << sk->sk_state) & ~(TCPF_ESTABLISHED | TCPF_CLOSE_WAIT))/* 只有這兩種狀態才能發送消息 */
		if ((err = sk_stream_wait_connect(sk, &timeo)) != 0)/* 其它狀態下等待連接正確建立,超時則進行錯誤處理 */
			goto out_err;

	/* This should be in poll */
	clear_bit(SOCK_ASYNC_NOSPACE, &sk->sk_socket->flags);

	/* 獲得有效的MSS,如果支持OOB,則不能支持TSO,MSS則應當是比較小的值 */
	mss_now = tcp_current_mss(sk, !(flags&MSG_OOB));

	/* Ok commence sending. */
	/* 獲取待發送緩衝區數組指針及其長度 */
	iovlen = msg->msg_iovlen;
	iov = msg->msg_iov;
	/* copied表示從用戶數據塊複製到skb中的位元組數。 */
	copied = 0;

	err = -EPIPE;
	/* 如果套介面存在錯誤,則不允許發送數據,返回EPIPE錯誤 */
	if (sk->sk_err || (sk->sk_shutdown & SEND_SHUTDOWN))
		goto do_error;

	while (--iovlen >= 0) {/* 處理所有待發送數據塊 */
		/*要分段緩衝區的指針和長度*/
		int seglen = iov->iov_len;
		unsigned char __user *from = iov->iov_base;

		iov++;

		while (seglen > 0) {/* 處理單個數據塊中的所有數據 */
			int copy;
			/*取傳輸隊列的上一個sk_buff指針,這下麵一小段的目的是檢查
			傳輸隊列是否有未滿段,未滿段是當前分段長度小於1mss。只有
			當現有分段滿負荷時,才能生成新的數據分段*/
			skb = sk->sk_write_queue.prev;

			/*隊列是一個雙向鏈表,通過隊列頭的prev來訪問套接字最後一個分段。
			首先檢查傳輸隊列頭是否有數據分段,如果該值是NULL,就沒必要
			檢查未滿分段。*/
			if (!sk->sk_send_head ||/* 發送隊列為空,前面取得的skb無效 */
				/* 如果skb有效,但是它已經沒有多餘的空間複製新數據了 */
			    (copy = mss_now - skb->len) <= 0) {
/*為用戶數據創建一個新的分段*/
new_segment:
				/* 發送隊列中數據長度達到發送緩衝區的上限,等待緩衝區 */
				if (!sk_stream_memory_free(sk))
					goto wait_for_sndbuf;

				/*如果有足夠的記憶體,就為TCP數據分段分配新緩衝區。如果硬體
				支持分散-聚集技術,就分配一個數據頁大小的緩衝區。否則就
				分配大小為1mss的緩衝區。*/
				skb = sk_stream_alloc_pskb(sk, select_size(sk, tp),
							   0, sk->sk_allocation);/* 分配新的skb */
				/* 分配失敗,說明系統記憶體不足,等待記憶體釋放 */
				if (!skb)
					goto wait_for_memory;

				/* 根據路由網路設備的特性,確定是否由硬體執行校驗和 */
				if (sk->sk_route_caps &
				    (NETIF_F_IP_CSUM | NETIF_F_NO_CSUM |
				     NETIF_F_HW_CSUM))
					skb->ip_summed = CHECKSUM_HW;

				skb_entail(sk, tp, skb);/* 將SKB新分段添加到發送隊列尾部 */
				copy = mss_now;/* 本次需要複製的數據量是MSS */
			}

			/* 要複製的數據長度copy不能大於當前段剩餘的長度,
			seglen的減法在下麵。*/
			if (copy > seglen)
				copy = seglen;

			/* skb線性存儲區底部還有空間 */
			if (skb_tailroom(skb) > 0) {
				/* 本次只複製skb存儲區底部剩餘空間大小的數據量 */
				if (copy > skb_tailroom(skb))
					copy = skb_tailroom(skb);
				/* 從用戶空間複製指定長度的數據到skb中,如果失敗,則退出 */
				if ((err = skb_add_data(skb, from, copy)) != 0)
					goto do_fault;
			} 
			/* 線性存儲區底部已經沒有空間了,複製到分散/聚集存儲區中 */
			else {
                        ...//忽略
                        }

			if (!copied)/* 如果沒有複製數據,則取消PSH標誌 */
				TCP_SKB_CB(skb)->flags &= ~TCPCB_FLAG_PSH;



			/* 更新發送隊列最後一個包的序號 */
			tp->write_seq += copy;
			/* 更新當前數據分段skb的結尾序號,以使其能夠包括當前段所
			覆蓋的全部序列。*/
			TCP_SKB_CB(skb)->end_seq += copy;
			skb_shinfo(skb)->tso_segs = 0;

			/* 更新數據複製的指針,使其指向下一個要複製的數據起始位置,
			然後更新要複製的位元組數。*/
			from += copy;
			copied += copy;
			/* 如果所有數據已經複製完畢則退出,會調用tcp_push()將傳輸
			隊列中的數據分段發送出去。*/
			if ((seglen -= copy) == 0 && iovlen == 0)
				goto out;

			/* 走到這裡說明還沒有將全部用戶緩衝區複製到套接字緩衝區,就檢查
			如果當前skb中的數據小於mss,說明可以往裡面繼續複製數據。
			或者發送的是OOB數據,則也跳過發送過程,繼續複製數據 */
			if (skb->len != mss_now || (flags & MSG_OOB))
				continue;

			/* 走到這裡說明當前數據段已滿。就調用foced_push()來檢查是否為
			傳輸隊列中的最後一個分段設置了強制push標誌。如果設置了強制push
			標誌,需要告訴接收端應用程式首先處理該數據。
			必須立即發送數據,即上次發送後產生的數據已經超過通告視窗值的一半 */
			if (forced_push(tp)) {
				/* 設置PSH標誌後發送數據 */
				tcp_mark_push(tp, skb);
				/*然後根據Nagle演算法、擁塞視窗、發送視窗調用此函數來啟動
				待發送分段的傳輸。*/
				__tcp_push_pending_frames(sk, tp, mss_now, TCP_NAGLE_PUSH);
			} 
			/* 雖然不是必鬚髮送數據,但是發送隊列上只存在當前段,也將其發送出去 */
			/*如果不能強制push該數據,並且傳輸隊列中僅有一個數據段,就調用
			tcp_push_one()來將該數據段push到傳輸隊列中。*/
			else if (skb == sk->sk_send_head)
				tcp_push_one(sk, mss_now);
			/*然後在內部迴圈迭代中對剩餘的數據進行分段處理。*/
			continue;

wait_for_sndbuf:
			/* 由於發送隊列滿的原因導致等待 */
			set_bit(SOCK_NOSPACE, &sk->sk_socket->flags);
wait_for_memory:
			if (copied)/* 雖然沒有記憶體了,但是本次調用複製了數據到緩衝區,調用tcp_push將其發送出去 */
				tcp_push(sk, tp, flags & ~MSG_MORE, mss_now, TCP_NAGLE_PUSH);

			/* 等待記憶體可用 */
			if ((err = sk_stream_wait_memory(sk, &timeo)) != 0)
				goto do_error;/* 確實沒有記憶體了,超時後返回失敗 */

			/* 睡眠後,MSS可能發生了變化,重新計算 */
			mss_now = tcp_current_mss(sk, !(flags&MSG_OOB));
		}
	}

out:
	if (copied)/* 從用戶態複製了數據,發送它 */
		tcp_push(sk, tp, flags, mss_now, tp->nonagle);
	TCP_CHECK_TIMER(sk);
	release_sock(sk);/* 釋放鎖以後返回 */
	return copied;

do_fault:
	if (!skb->len) {/* 複製數據失敗了,如果skb長度為0,說明是新分配的,釋放它 */
		if (sk->sk_send_head == skb)/* 如果skb是發送隊列頭,則清空隊列頭 */
			sk->sk_send_head = NULL;
		__skb_unlink(skb, skb->list);
		sk_stream_free_skb(sk, skb);/* 釋放skb */
	}

do_error:
	if (copied)
		goto out;
out_err:
	err = sk_stream_error(sk, flags, err);
	TCP_CHECK_TIMER(sk);
	release_sock(sk);
	return err;
}

詳細的說明見註釋。

註意幾點主要的流程:

1.TCP以1mss為單元來發送數據,最大段大小基於MTU計算獲得,MTU是一個鏈路層的特征參數,並且可以從tcp_current_mss()獲取。

2.sk_stream_alloc_pskb()為TCP數據分配一個新的緩衝區,它的最小長度是1mss。

3.skb_entail()將報文發往傳輸緩存區排隊,並計算已分配的緩衝區記憶體。

4.tcp_push_one()負責傳輸寫隊列中的一個數據段。__tcp_push_pending_frames()負責傳輸在寫隊列中排隊的多個數據段。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • <ul id="ul1"> <li></li> <li></li> </ul> window.onload = function(){ var aLi = document.getElementsByTagName("li"); // var page = 1; //有了頁碼寫進去 var togg ...
  • JavaScript是ECMAScript的實現和擴展,ES6標準的制定也為JavaScript加入了許多新特性。本文主要記錄展開運算符。 展開運算符(spread operator)允許一個表達式在某處展開。展開運算符在多個參數(用於函數調用)或多個元素(用於數組字面量)或者多個變數(用於解構賦值 ...
  • 1. width:0; 光有高度是不行的,還得有寬度。缺點文字隱藏不了,可以加個 和背景顏色一樣就ok了,障眼法,迷惑人的,其實內容還在,如果有文字的話,還是可以觸發點擊事件的,這種做法很多黑客就會利用在目標站點鏈接上加一個和背景顏色一樣的讓管理員發現不了。 2. height:0; 和上面一樣,一 ...
  • 前幾天在院子里看了一個大牛用js寫了一個路由的,有一句代碼一直不知道怎麼回事,後來就自己寫了一個,寫的比較的粗糙,我覺得把面向對象的思想都搞得亂七八糟的,不過功能實現了. ...
  • 本文地址:http://www.cnblogs.com/wuyudong/p/5904528.html,轉載請註明源地址。 本文對之前手機衛士開發進行一個小結。 1、SplashActivity 版本名稱的展示,從清單配置文件中獲取版本名稱,PackageManager 服務端新版本的檢測(本地版本 ...
  • 文本框(UITextField) 本章節繼續編輯 JXHypnoNerd 。文件地址 。 首先我們繼續編輯 JXHypnosisViewController.m 修改 loadView 方法,向 view 中添加一個 UITextField 對象: 構建並運行應用,項目中會顯示一個文本框,該文本框就 ...
  • 本文地址:http://www.cnblogs.com/wuyudong/p/5903707.html,轉載請註明源地址。 在手機衛士之前的版本升級的對話框中: 有的用戶暫時不想更新,沒有點擊“稍後再說”,而是選擇點擊回退按鍵,那麼這時候的邏輯應該是讓用戶進入home界面而不是splash界面。所以 ...
  • Activity有些公共部分,比如setContentView、Activity管理、初始化操作、聯網操作、Activity跳轉、關閉當前Activity、保存用戶登錄信息、讀取用戶登錄信息等。 我們可以抽取成一個抽象類BaseActivity,再新建Activity的時候,繼承BaseActivi ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...