這篇文章將對linux下udp socket編程重要知識點進行總結,無論是開發人員應知應會的,還是說udp socket的一些偏僻知識點,本文都會講到。儘可能做到,讀了一篇文章之後,大家對udp socket有一個比較全面的認識。本文分為兩個專題,第一個是常用的upd socket框架,第二個是一些 ...
這篇文章將對linux下udp socket編程重要知識點進行總結,無論是開發人員應知應會的,還是說udp socket的一些偏僻知識點,本文都會講到。儘可能做到,讀了一篇文章之後,大家對udp socket有一個比較全面的認識。本文分為兩個專題,第一個是常用的upd socket框架,第二個是一些udp socket並不常用但又相當重要的知識點。
一、基本的udp socket編程
1. UDP編程框架
要使用UDP協議進行程式開發,我們必須首先得理解什麼是什麼是UDP?這裡簡單概括一下。
UDP(user datagram protocol)的中文叫用戶數據報協議,屬於傳輸層。UDP是面向非連接的協議,它不與對方建立連接,而是直接把我要發的數據報發給對方。所以UDP適用於一次傳輸數據量很少、對可靠性要求不高的或對實時性要求高的應用場景。正因為UDP無需建立類如三次握手的連接,而使得通信效率很高。
UDP的應用非常廣泛,比如一些知名的應用層協議(SNMP、DNS)都是基於UDP的,想一想,如果SNMP使用的是TCP的話,每次查詢請求都得進行三次握手,這個花費的時間估計是使用者不能忍受的,因為這會產生明顯的卡頓。所以UDP就是SNMP的一個很好的選擇了,要是查詢過程發生丟包錯包也沒關係的,我們再發起一個查詢就好了,因為丟包的情況不多,這樣總比每次查詢都卡頓一下更容易讓人接受吧。
UDP通信的流程比較簡單,因此要搭建這麼一個常用的UDP通信框架也是比較簡單的。以下是UDP的框架圖。
由以上框圖可以看出,客戶端要發起一次請求,僅僅需要兩個步驟(socket和sendto),而伺服器端也僅僅需要三個步驟即可接收到來自客戶端的消息(socket、bind、recvfrom)。
2. UDP程式設計常用函數
#include <sys/types.h> #include <sys/socket.h> int socket(int domain, int type, int protocol);參數domain:用於設置網路通信的域,socket根據這個參數選擇信息協議的族 Name Purpose AF_UNIX, AF_LOCAL Local communication AF_INET IPv4 Internet protocols //用於IPV4 AF_INET6 IPv6 Internet protocols //用於IPV6 AF_IPX IPX - Novell protocols AF_NETLINK Kernel user interface device AF_X25 ITU-T X.25 / ISO-8208 protocol AF_AX25 Amateur radio AX.25 protocol AF_ATMPVC Access to raw ATM PVCs AF_APPLETALK AppleTalk AF_PACKET Low level packet interface AF_ALG Interface to kernel crypto API 對於該參數我們僅需熟記AF_INET和AF_INET6即可 小插曲:PF_XXX和AF_XXX 我們在看Linux網路編程相關代碼時會發現PF_XXX和AF_XXX會混著用,他們倆有什麼區別呢?以下內容摘自《UNP》。 AF_首碼表示地址族(Address Family),而PF_首碼表示協議族(Protocol Family)。歷史上曾有這樣的想法:單個協議族可以支持多個地址族,PF_的值可以用來創建套接字,而AF_值用於套接字的地址結構。但實際上,支持多個地址族的協議族從來就沒實現過,而頭文件<sys/socket.h>中為一給定的協議定義的PF_值總是與此協議的AF_值相同。 所以我在實際編程時還是偏向於使用AF_XXX。 參數type(只列出最重要的三個): SOCK_STREAM Provides sequenced, reliable, two-way, connection-based byte streams. //用於TCP SOCK_DGRAM Supports datagrams (connectionless, unreliable messages ). //用於UDP SOCK_RAW Provides raw network protocol access. //RAW類型,用於提供原始網路訪問 參數protocol:置0即可 返回值:成功:非負的文件描述符 失敗:-1
#include <sys/types.h> #include <sys/socket.h> ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);第一個參數sockfd:正在監聽埠的套介面文件描述符,通過socket獲得 第二個參數buf:發送緩衝區,往往是使用者定義的數組,該數組裝有要發送的數據 第三個參數len:發送緩衝區的大小,單位是位元組 第四個參數flags:填0即可 第五個參數dest_addr:指向接收數據的主機地址信息的結構體,也就是該參數指定數據要發送到哪個主機哪個進程 第六個參數addrlen:表示第五個參數所指向內容的長度 返回值:成功:返回發送成功的數據長度 失敗: -1
#include <sys/types.h> #include <sys/socket.h> ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);第一個參數sockfd:正在監聽埠的套介面文件描述符,通過socket獲得 第二個參數buf:接收緩衝區,往往是使用者定義的數組,該數組裝有接收到的數據 第三個參數len:接收緩衝區的大小,單位是位元組 第四個參數flags:填0即可 第五個參數src_addr:指向發送數據的主機地址信息的結構體,也就是我們可以從該參數獲取到數據是誰發出的 第六個參數addrlen:表示第五個參數所指向內容的長度 返回值:成功:返回接收成功的數據長度 失敗: -1
#include <sys/types.h> #include <sys/socket.h> int bind(int sockfd, const struct sockaddr* my_addr, socklen_t addrlen);第一個參數sockfd:正在監聽埠的套介面文件描述符,通過socket獲得 第二個參數my_addr:需要綁定的IP和埠 第三個參數addrlen:my_addr的結構體的大小 返回值:成功:0 失敗:-1
#include <unistd.h> int close(int fd);close函數比較簡單,只要填入socket產生的fd即可。
3. 搭建UDP通信框架
server:
1 #include <stdio.h> 2 #include <sys/types.h> 3 #include <sys/socket.h> 4 #include <netinet/in.h> 5 #include <string.h> 6 7 #define SERVER_PORT 8888 8 #define BUFF_LEN 1024 9 10 void handle_udp_msg(int fd) 11 { 12 char buf[BUFF_LEN]; //接收緩衝區,1024位元組 13 socklen_t len; 14 int count; 15 struct sockaddr_in clent_addr; //clent_addr用於記錄發送方的地址信息 16 while(1) 17 { 18 memset(buf, 0, BUFF_LEN); 19 len = sizeof(clent_addr); 20 count = recvfrom(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&clent_addr, &len); //recvfrom是擁塞函數,沒有數據就一直擁塞 21 if(count == -1) 22 { 23 printf("recieve data fail!\n"); 24 return; 25 } 26 printf("client:%s\n",buf); //列印client發過來的信息 27 memset(buf, 0, BUFF_LEN); 28 sprintf(buf, "I have recieved %d bytes data!\n", count); //回覆client 29 printf("server:%s\n",buf); //列印自己發送的信息給 30 sendto(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&clent_addr, len); //發送信息給client,註意使用了clent_addr結構體指針 31 32 } 33 } 34 35 36 /* 37 server: 38 socket-->bind-->recvfrom-->sendto-->close 39 */ 40 41 int main(int argc, char* argv[]) 42 { 43 int server_fd, ret; 44 struct sockaddr_in ser_addr; 45 46 server_fd = socket(AF_INET, SOCK_DGRAM, 0); //AF_INET:IPV4;SOCK_DGRAM:UDP 47 if(server_fd < 0) 48 { 49 printf("create socket fail!\n"); 50 return -1; 51 } 52 53 memset(&ser_addr, 0, sizeof(ser_addr)); 54 ser_addr.sin_family = AF_INET; 55 ser_addr.sin_addr.s_addr = htonl(INADDR_ANY); //IP地址,需要進行網路序轉換,INADDR_ANY:本地地址 56 ser_addr.sin_port = htons(SERVER_PORT); //埠號,需要網路序轉換 57 58 ret = bind(server_fd, (struct sockaddr*)&ser_addr, sizeof(ser_addr)); 59 if(ret < 0) 60 { 61 printf("socket bind fail!\n"); 62 return -1; 63 } 64 65 handle_udp_msg(server_fd); //處理接收到的數據 66 67 close(server_fd); 68 return 0; 69 }
client:
1 #include <stdio.h> 2 #include <sys/types.h> 3 #include <sys/socket.h> 4 #include <netinet/in.h> 5 #include <string.h> 6 7 #define SERVER_PORT 8888 8 #define BUFF_LEN 512 9 #define SERVER_IP "172.0.5.182" 10 11 12 void udp_msg_sender(int fd, struct sockaddr* dst) 13 { 14 15 socklen_t len; 16 struct sockaddr_in src; 17 while(1) 18 { 19 char buf[BUFF_LEN] = "TEST UDP MSG!\n"; 20 len = sizeof(*dst); 21 printf("client:%s\n",buf); //列印自己發送的信息 22 sendto(fd, buf, BUFF_LEN, 0, dst, len); 23 memset(buf, 0, BUFF_LEN); 24 recvfrom(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&src, &len); //接收來自server的信息 25 printf("server:%s\n",buf); 26 sleep(1); //一秒發送一次消息 27 } 28 } 29 30 /* 31 client: 32 socket-->sendto-->revcfrom-->close 33 */ 34 35 int main(int argc, char* argv[]) 36 { 37 int client_fd; 38 struct sockaddr_in ser_addr; 39 40 client_fd = socket(AF_INET, SOCK_DGRAM, 0); 41 if(client_fd < 0) 42 { 43 printf("create socket fail!\n"); 44 return -1; 45 } 46 47 memset(&ser_addr, 0, sizeof(ser_addr)); 48 ser_addr.sin_family = AF_INET; 49 //ser_addr.sin_addr.s_addr = inet_addr(SERVER_IP); 50 ser_addr.sin_addr.s_addr = htonl(INADDR_ANY); //註意網路序轉換 51 ser_addr.sin_port = htons(SERVER_PORT); //註意網路序轉換 52 53 udp_msg_sender(client_fd, (struct sockaddr*)&ser_addr); 54 55 close(client_fd); 56 57 return 0; 58 }以上的框架用於一臺主機不同埠的UDP通信,現象如下: 我們先建立server端,等待服務;然後我們建立client端請求服務。 server端:
client端: 自己主機跟自己通信不是很爽,我們想跟其他主機通信怎麼搞?很簡單,上面client的代碼的第49行的註釋打開,並註釋掉下麵那行,在巨集定義里填入自己想通信的serverip就可以了。現象如下: server端: client端: 這樣我們就實現了主機172.0.5.183和172.0.5.182之間的網路通信。 UDP通用框架搭建完成,我們可以利用該框架跟指定主機進行通信了。 如果想學習UDP的基礎知識,以上的知識就足夠了;如果想繼續深入學習一下UDP SOCKET一些高級知識(奇技淫巧),可以花點時間往下看。 二、高級udp socket編程
1. udp的connect函數
什麼?UDP也有conenct?connect不是用於TCP編程的嗎?
是的,UDP網路編程中的確有connect函數,但它僅僅用於表示確定了另一方的地址,並沒有其他含義。
有了以上認識後,我們可以知道UDP套接字有以下區分:
1)未連接的UDP套接字
2)已連接的UDP套接字
對於未連接的套接字,也就是我們常用的的UDP套接字,我們使用的是sendto/recvfrom進行信息的收發,目標主機的IP和埠是在調用sendto/recvfrom時確定的;
在一個未連接的UDP套接字上給兩個數據報調用sendto函數內核將執行以下六個步驟:
1)連接套接字
2)輸出第一個數據報
3)斷開套接字連接
4)連接套接字
5)輸出第二個數據報
6)斷開套接字連接
對於已連接的UDP套接字,必須先經過connect來向目標伺服器進行指定,然後調用read/write進行信息的收發,目標主機的IP和埠是在connect時確定的,也就是說,一旦conenct成功,我們就只能對該主機進行收發信息了。
已連接的UDP套接字給兩個數據報調用write函數內核將執行以下三個步驟:
1)連接套接字
2)輸出第一個數據報
3)輸出第二個數據報
由此可以知道,當應用進程知道給同一個目的地址的埠號發送多個數據報時,顯示套接字效率更高。
下麵給出帶connect函數的UDP通信框架
具體框架代碼不再給出了,因為跟上面不帶connect的代碼大同小異,僅僅多出一個connect函數處理而已,下麵給出處理conenct()的基本步驟。
void udp_handler(int s, struct sockaddr* to) { char buf[1024] = "TEST UDP !"; int n = 0; connect(s, to, sizeof(*to); n = write(s, buf, 1024); read(s, buf, n); }
2. udp報文丟失問題
因為UDP自身的特點,決定了UDP會相對於TCP存在一些難以解決的問題。第一個就是UDP報文缺失問題。
在UDP伺服器客戶端的例子中,如果客戶端發送的數據丟失,伺服器會一直等待,直到客戶端的合法數據過來。如果伺服器的響應在中間被路由丟棄,則客戶端會一直阻塞,直到伺服器數據過來。
防止這樣的永久阻塞的一般方法是給客戶的recvfrom調用設置一個超時,大概有這麼兩種方法:
1)使用信號SIGALRM為recvfrom設置超時。首先我們為SIGALARM建立一個信號處理函數,併在每次調用前通過alarm設置一個5秒的超時。如果recvfrom被我們的信號處理函數中斷了,那就超時重發信息;若正常讀到數據了,就關閉報警時鐘並繼續進行下去。
2)使用select為recvfrom設置超時
設置select函數的第五個參數即可。
3. udp報文亂序問題
所謂亂序就是發送數據的順序和接收數據的順序不一致,例如發送數據的順序為A、B、C,但是接收到的數據順序卻為:A、C、B。產生這個問題的原因在於,每個數據報走的路由並不一樣,有的路由順暢,有的卻擁塞,這導致每個數據報到達目的地的順序就不一樣了。UDP協議並不保證數據報的按序接收。
解決這個問題的方法就是發送端在發送數據時加入數據報序號,這樣接收端接收到報文後可以先檢查數據報的序號,並將它們按序排隊,形成有序的數據報。
4. udp流量控制問題
總所周知,TCP有滑動視窗進行流量控制和擁塞控制,反觀UDP因為其特點無法做到。UDP接收數據時直接將數據放進緩衝區內,如果用戶沒有及時將緩衝區的內容複製出來放好的話,後面的到來的數據會接著往緩衝區放,當緩衝區滿時,後來的到的數據就會覆蓋先來的數據而造成數據丟失(因為內核使用的UDP緩衝區是環形緩衝區)。因此,一旦發送方在某個時間點爆發性發送消息,接收方將因為來不及接收而發生信息丟失。
解決方法一般採用增大UDP緩衝區,使得接收方的接收能力大於發送方的發送能力。
這樣我們就把接收方的接收隊列擴大了,從而儘量避免丟失數據的發生。 參考書目:
《UNIX網路編程捲1》
《Linux網路編程》
《嵌入式Linux軟體開發從入門到精通》