[httpserver]如何解析HTTP請求報文

来源:http://www.cnblogs.com/h-hq/archive/2016/11/07/6037365.html
-Advertisement-
Play Games

在正常的開發中,應該根據不同的請求做出不同的響應。要做到上述的功能,首先要解析客戶端發來的請求報文。 報文在不同的上下文情景下有不同的理解,本文所說的報文都是在HTTP上下文中描述的名詞。 ...


上一篇文章中,講述瞭如何編寫一個最簡單的server,但該程式只是接受到請求之後馬上返迴響應,實在不能更簡單。在正常的開發中,應該根據不同的請求做出不同的響應。要做到上述的功能,首先要解析客戶端發來的請求報文。

報文在不同的上下文情景下有不同的理解,本文所說的報文都是在HTTP上下文中描述的名詞。

HTTP報文是什麼

在HTTP程式中,報文就是HTTP用來搬運東西的包裹,也可以理解為程式之間傳遞信息時發送的數據塊。這些數據塊以一些文本形式的元信息開頭,這些信息描述了報文的內容和含義,後面跟著可選的數據部分。

報文的流動

HTTP使用屬於流入和流出來描述報文的傳遞方向。HTTP報文會像合水一樣流動。不管時請求報文還是響應報文,都會向下游流動,所有報文的發送者都在接受者的上游。下圖展示了報文向下游流動的例子。

報文向下游流動

報文的組成

報文由三個部分組成:

  • 對報文進行描述的起始行
  • 包含屬性的首部塊
  • 可選的、包含數據的主體部分

起始行和首部是由行分隔的ASCII文本。每行都以一個由兩個字元(回車符--ASCII碼13和換行符--ASCII碼10)組成的行終止序列結束。可以寫做CRLF

儘管規範說明應該用CRLF來表示行終止,但穩健的應用程式也應該接受單個換行作為行的終止。筆者僅支持以CRLF換行的解析,因為我覺得既然有了規範,那就需要遵循,遵循相同的協議的程式才能互相通信。

實體是一個可選的數據塊。與起始行和首部不同的是,主體中可以包含主體或二進位數據,也可以為空(比如僅僅GET一個頁面或文件)。

下麵來看看報文的語法的格式和規則。

報文的語法

請求報文的語法:

<method> <request-URL> <version>
<headers>

<entity-body>

響應報文的語法:

<version> <status-code> <reason-phrase>
<headers>

<entity-body>

method,方法

客戶端希望伺服器對資源執行的操作。比如GET、POST

request-URL,請求URL

請求資源,或者URL路徑組件的完整URL。

version,版本

報文所使用的HTTP版本。格式:HTTP/.。其中major(主要版本號)和minor(次要版本號)都是整數。

status-code,狀態碼

描述請求過程所發生的情況的數字。

reason-phrase,原因短語

數字狀態碼的文字描述版本。

headers,首部

每個首部包含一個名字,後面跟著一個冒號(:),然後是一個可選的空格,接著是一個值,最後是一個CRLF。可以有零個或多個首部。首部由一個CRLF結束,表示首部結束和實體主體開始。

entity-body,實體的主體部分

包含一個由任意數據組成的數據塊。可以沒有,此時是以一個CRLF結束。

請求行

請求報文的起始行稱為請求行。所有的HTTP報文都以一行起始行作為開始。請求行包含一個方法和一個請求URL以及HTTP的版本三個欄位。每個欄位都以空格分隔。

比如:GET / HTTP/1.1

請求方法為GET,請求URL為/,HTTP版本為HTTP/1.1。

響應行

響應報文的起始行稱為響應行。響應行包含HTTP版本、數字狀態碼以及描述操作狀態的文本形式的原因短語。三個欄位也是以空格分隔。

比如:HTTP/1.1 200 OK

HTTP版本為HTTP/1.1,數字狀態碼是200,原因短語是OK。表示請求成功。

首部

首部是是包含在請求和響應報文的一些附加信息。本質上,他們只是一些鍵值對的列表。

比如:Content-Length: 19

表示返回內容長度為19。

實體的主體部分

簡單地說,這部分就是HTTP要傳輸的內容。

解析請求報文

瞭解了報文是如何組成和各部分代表的內容之後,就對如何解析請求報文心裡有數了。

核心代碼

    /* 解析請求行 */
    int parse_start_line(int sockfd, char *recv_buf, req_pack *rp)
    {
        char *p = recv_buf;
        char *ch = p;
        int i = 0;
        enum parts { method, url, ver } req_part = method;
        char *method_str;
        char *url_str;
        char *ver_str;
        int k = 0;

        if (*ch < 'A' || *ch > 'Z') {
            return -1;
        }

        while (*ch != CR) {
            if (*ch != BLANK) {
                k++;
            } else if (req_part == method) {
                method_str = (char *)malloc(k * sizeof(char *));
                memset(method_str, 0, sizeof(char *));
                strncpy(method_str, recv_buf, k);
                k = 0;
                req_part = url;
            } else if (req_part == url) {
                url_str = (char *)malloc(k * sizeof(char *));
                memset(url_str, 0, sizeof(char *));
                strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
                k = 0;
                req_part = ver;
            }
            ch++;
            i++;
        }

        if (req_part == url) {
            if (k != 0) {
                url_str = (char *)malloc(k * sizeof(char));
                memset(url_str, 0, sizeof(char));
                strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
                k = 0;
            } else {
                return -1;
            }
        }

        if (k == 0) {
            ver_str = (char *)malloc(8 * sizeof(char));
            memset(ver_str, 0, sizeof(char));
            strcpy(ver_str, "HTTP/1.1");
        } else {
            ver_str = (char *)malloc(k * sizeof(char));
            memset(ver_str, 0, sizeof(char));
            strncpy(ver_str,
                    recv_buf + strlen(method_str) + strlen(url_str) + 2, k);
        }

        rp->method = method_str;
        rp->url = url_str;
        rp->version = ver_str;

        return (i + 2);
    }

    /* 解析首部欄位 */
    int parse_header(int sockfd, char *recv_buf, header headers[])
    {
        char *p = recv_buf;
        char *ch = p;
        int i = 0;
        int k = 0;
        int v = 0;
        int h_i = 0;
        bool is_newline = false;
        char *key_str;
        char *value_str;
        header *tmp_header = (header *)malloc(sizeof(header *));
        memset(tmp_header, 0, sizeof(header));

        while (1) {
            if (*ch == CR && *(ch + 1) == LF) {
                break;
            }
            while (*ch != COLON) {
                ch++;
                i++;
                k++;
            }
            if (*ch == COLON) {
                key_str = (char *)malloc(k * sizeof(char *));
                memset(key_str, 0, sizeof(char *));
                strncpy(key_str, recv_buf + i - k, k);
                k = 0;
                ch++;
                i++;
            }
            while (*ch != CR) {
                ch++;
                i++;
                v++;
            }
            if (*ch == CR) {
                value_str = (char *)malloc(v * sizeof(char *));
                memset(value_str, 0, sizeof(char *));
                strncpy(value_str, recv_buf + i - v, v);
                v = 0;
                i++;
                ch++;
            }
            i++;
            ch++;
            headers[h_i].key = key_str;
            headers[h_i].value = value_str;
            h_i++;
        }

        return (i + 2);
    }

解析思想

遍歷recv接受到的請求字元串,檢查是否遇到回車符\r判斷一行數據。

對於起始行,檢查是否遇到空格分隔不同的欄位;對於首部,檢查是否遇到冒號分隔鍵值對的欄位值;對於實體的主體部分,則先判斷是否遇到CRLF字元串,然後將剩餘內容全部作為實體的主體部分。

返回值是告知程式下一次遍歷的起始位置。

如果遇到非法請求行則返回400的響應。

總結

解析報文的過程就是遵循HTTP協議規定的內容去解析報文,獲取報文包含的信息。

由於基礎知識較薄弱,代碼還有很多錯誤以及很多地方需要優化。如果有看到錯誤的地方或有其它建議望各位大俠不吝賜教。^_^

原創文章,文筆有限,才疏學淺,文中若有不正之處,萬望告知。

如果本文對你有幫助,請點下推薦吧,謝謝^_^


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • http://www.jxedt.com/wen/yueche/3174960937224896527.html http://www.jxedt.com/wen/yueche/3174960954294009881.html http://www.jxedt.com/wen/yueche/3174 ...
  • http://www.jxedt.com/wen/luxian/3174961955107373081.html http://www.jxedt.com/wen/luxian/3174961955107504153.html http://www.jxedt.com/wen/luxian/3174 ...
  • http://www.jxedt.com/wen/luxian/3174967142117802019.html http://www.jxedt.com/wen/luxian/3174967142944342104.html http://www.jxedt.com/wen/luxian/3174 ...
  • http://www.jxedt.com/wen/luxian/3174952620276514904.html http://www.jxedt.com/wen/luxian/3174952621607551011.html http://www.jxedt.com/wen/luxian/3174 ...
  • 一、NuGet是什麼? NuGet是Microsoft開發平臺的程式集包管理器,它由客戶端工具和服務端站點組成,客戶端工具提供給用戶管理和安裝/卸載軟體程式包,以及打包和發佈程式包到NuGet服務端站點等功能,服務端站點存儲已經發行的軟體包,併為NuGet客戶端軟體包庫提供服務,使軟體包共用給其他的 ...
  • 英文文檔: 2. 函數可以接收一個可選的default參數,傳入default參數後,如果可迭代對象還有元素沒有返回,則依次返回其元素值,如果所有元素已經返回,則返回default指定的預設值而不拋出StopIteration 異常。 ...
  • 英文文檔: min(iterable, *[, key, default]) min(arg1, arg2, *args[, key]) Return the smallest item in an iterable or the smallest of two or more arguments. ...
  • 今日問題: 請問主程式能否正常編譯通過?(點擊以下“【Java每日一題】20161107”查看20161104問題解析) 題目原發佈於公眾號、簡書:【Java每日一題】20161107,【Java每日一題】20161107 每日一題最新將在公眾號發佈,歡迎訂閱,交流進步 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...