動手做webserver的核心之http解析

来源:https://www.cnblogs.com/yswenli/archive/2018/07/17/9326453.html
-Advertisement-
Play Games

簡介 webserver往小里說核心功能就是socket管理、url處理、http協議處理、業務dll管理等;下麵簡介紹一下http協議:超文本傳輸協議(HTTP)是一種通信協議,當時就是為web傳輸設計的一個基於tcp的協議;基於這個字面上理解,可以簡單的點說就是用tcp來傳輸文本、數據的一種編解 ...


簡介

        webserver往小里說核心功能就是socket管理、url處理、http協議處理、業務dll管理等;下麵簡介紹一下http協議:超文本傳輸協議(HTTP)是一種通信協議,當時就是為web傳輸設計的一個基於tcp的協議;基於這個字面上理解,可以簡單的點說就是用tcp來傳輸文本、數據的一種編解碼格式。傳輸協議一般比如說定個長度+內容,或者以回車符作為結尾等方式。http協議是文本傳輸協議,所以也是採用回車符來結尾的方式來實現編碼傳輸解析的; 這裡使用分析工具來簡單分析一下http的基本格式:

      從上圖可以看出http的基本格式一般大體為成header和body,header的第一行是固定的status line,header與body之間用回車符+空行+回車符來分隔的

GET

      webserver一般收到get請求如下:

1  GET /yswenli/p/8858669.html HTTP/1.1 
2  Host www.cnblogs.com
3  User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36  Accept image/webp,image/*,*/*;q=0.8 
4  Referer https://www.cnblogs.com/yswenli/p/8858669.html 
5  Accept-Encoding gzip, deflate, sdch  
6  Accept-Language zh-CN,zh;q=0.8

      也就是說如果發起了一個get請求的時候,webserver只是收到一個一個http header,直接全部收取後解析就行

POST

       如果是一個post請求呢?查看html相關內容,可以看post有很多方式,總體上分成三種,一種是預設的application/x-www-form-urlencoded:

1 POST http://www.example.com HTTP/1.1
2 Content-Type: application/x-www-form-urlencoded;charset=utf-8
3 
4 title=test&sub%5B%5D=1&sub%5B%5D=2&sub%5B%5D=3

      這種格式就是帶有header和body兩部分內容,解析的時候可以先按get收頭部,然後再取body,body裡面的參數取值是先urldecode再htmldecode就可以了。

      第二種就是json、xml、plaine等:

1 POST http://www.example.com HTTP/1.1 
2 Content-Type: application/json;charset=utf-8
3 
4 {"title":"test","sub":[1,2,3]}

      這種和上面類似,不過在取body的時候直接讀就行~

      還有第三種multipart/form-data,這種模式格式比較複雜,它支持多鍵值對、多文件的方式,使用特定的boundary來分隔body

 1 POST http://www.example.com HTTP/1.1
 2 Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA
 3 
 4 ------WebKitFormBoundaryrGKCBY7qhFd3TrwA
 5 Content-Disposition: form-data; name="name"
 6 
 7 yswenli
 8 ------WebKitFormBoundaryrGKCBY7qhFd3TrwA
 9 Content-Disposition: form-data; name="file"; filename="chrome.png"
10 Content-Type: image/png
11 
12 PNG ... content of chrome.png ... 
13 ------WebKitFormBoundaryrGKCBY7qhFd3TrwA
14 Content-Disposition: form-data; name="text"
15 
16 title
17 ------WebKitFormBoundaryrGKCBY7qhFd3TrwA
18 Content-Disposition: form-data; name="file"; filename="chrome2.png"
19 Content-Type: image/png
20 
21 PNG ... content of chrome.png ...
22 ------WebKitFormBoundaryrGKCBY7qhFd3TrwA--

      這種格式也是帶有header和body兩部分內容,解析的時候先按get收頭部,然後再取body,body裡面的內容先按boundry進行分割,然後再根據content-type進行判斷取出文件內容。

TCP轉HTTP

      即然拿到相關數據格式,並研究分析了http的編碼格式,下麵就可以開始解碼了。首先使用一個data來接收socket的tcp數據包,然後統一分析http包的header,直到截取到\r\n+""+\r\n為止。

 1             using (MemoryStream ms = new MemoryStream(buffer))
 2             {
 3                 ms.Position = 0;
 4 
 5                 using (SAEA.Common.StreamReader streamReader = new SAEA.Common.StreamReader(ms))
 6                 {
 7                     while (true)
 8                     {
 9                         var str = streamReader.ReadLine();
10                         if (str == string.Empty)
11                         {
12                             this.HeaderStr = _stringBuilder.ToString();
13                             _stringBuilder.Clear();
14                             break;
15                         }
16                         else if (str == null && string.IsNullOrEmpty(this.HeaderStr))
17                         {
18                             return false;
19 
20                         }
21                         else
22                             _stringBuilder.AppendLine(str);
23                     }
24                 }
25             }

      上面使用了一個自定義的StreamReader,原因是自帶的那個無法定位Stream的Position;若已成功解析出http的header,接下來就可以根據header來判斷提交的方式是get還是post等。

 1         /// <summary>
 2         /// 解析http請求的數據
 3         /// </summary>
 4         /// <param name="data"></param>
 5         /// <param name="onUnpackage"></param>
 6         public void GetRequest(byte[] data, Action<RequestDataReader> onUnpackage)
 7         {
 8             lock (_locker)
 9             {
10                 _cache.AddRange(data);
11 
12                 var buffer = _cache.ToArray();
13 
14                 if (!isAnalysis)
15                 {
16                     isAnalysis = _httpStringReader.Analysis(buffer);
17                 }
18                 if (isAnalysis)
19                 {
20                     //post需要處理body
21                     if (_httpStringReader.Method == ConstString.POSTStr)
22                     {
23                         var contentLen = _httpStringReader.ContentLength;
24                         var positon = _httpStringReader.Position;
25                         var totlalLen = contentLen + positon;
26                         if (buffer.Length == totlalLen)
27                         {
28                             _httpStringReader.AnalysisBody(buffer);
29                             onUnpackage.Invoke(_httpStringReader);
30                             Array.Clear(buffer, 0, buffer.Length);
31                             buffer = null;
32                             _cache.Clear();
33                             _cache = null;
34                         }
35                     }
36                     else
37                     {
38                         onUnpackage.Invoke(_httpStringReader);
39                         Array.Clear(buffer, 0, buffer.Length);
40                         buffer = null;
41                         _cache.Clear();
42                         _cache = null;
43                     }
44                 }
45             }
46         }

      已解析header的話,就可以根據上面說的相關post的http數據格式來解析body。

 1                switch (this.ContentType)
 2                 {
 3                     case ConstString.FORMENCTYPE1:
 4                         this.Forms = GetRequestForms(Encoding.UTF8.GetString(this.Body));
 5                         break;
 6                     case ConstString.FORMENCTYPE2:
 7                         //todo
 8                         using (MemoryStream ms = new MemoryStream(this.Body))
 9                         {
10                             ms.Position = 0;
11                             using (var sr = new SAEA.Common.StreamReader(ms))
12                             {
13                                 StringBuilder sb = new StringBuilder();
14                                 var str = string.Empty;
15                                 do
16                                 {
17                                     str = sr.ReadLine();
18                                     if (str == null)
19                                     {
20                                         break;
21                                     }
22                                     else
23                                     {
24                                         sb.AppendLine(str);
25                                         if (str.IndexOf(CT) > -1)
26                                         {
27                                             var filePart = GetRequestFormsWithMultiPart(sb.ToString());
28 
29                                             if (filePart != null)
30                                             {
31                                                 sr.ReadLine();
32 
33                                                 filePart.Data = sr.ReadData(sr.Position, this.Boundary);
34                                                 if (filePart.Data != null)
35                                                 {
36                                                     filePart.Data = filePart.Data.Take(filePart.Data.Length - 2).ToArray();
37                                                 }
38                                                 if (this.PostFiles == null)
39                                                     this.PostFiles = new List<FilePart>();
40                                                 this.PostFiles.Add(filePart);
41                                             }
42                                             sb.Clear();
43                                             sr.ReadLine();
44                                         }
45                                     }
46                                 }
47                                 while (true);
48 
49                             }
50                         }
51                         break;
52                     default:
53                         this.Json = Encoding.UTF8.GetString(this.Body);
54                         break;
55                 }

      至此,http的相關解析就完成了,詳細的代碼可參見:

      1.HCode主要功能收取tcp包、 

      2.RequestDataReader主要功能是收到的tcp包近http協議轉成webrequest、

      3.HttpRequest主要功能是將轉換的數據進行model賦值、

      4.HttpContext主要功能是映射到處理業務並返回http數據

 

轉載請標明本文來源:https://www.cnblogs.com/yswenli/p/9326453.html
更多內容歡迎star/fork作者的github:https://github.com/yswenli/SAEA
如果發現本文有什麼問題和任何建議,也隨時歡迎交流~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 2018-07-17 函數名的應用 1.函數名的記憶體地址 2.函數名可以賦值給其他的變數 3.函數名可以當做容器的元素 4.函數名可以當做函數的參數進行傳遞 5.函數名也可以當做另一個函數的返回值 ...
  • http://codeforces.com/contest/757/problem/E 題意 Sol 非常騷的一道題 首先把給的式子化一下,設$u = d$,那麼$v = n / d$ $$f_r(n) = \sum_{d \mid n} \frac{f_{r - 1}(d) + f_{r - 1} ...
  • 本文主要用於彙總在python開發過程中遇到的各種環境、工具相關問題,便於後續遇到相關問題,及時搞定,持續更新。 一、安裝pip失敗,具體如下: 錯誤信息: 解決方法: ...
  • 瀏覽器的請求 url=請求協議(http/https)+網站功能變數名稱+資源路徑+參數 http:超文本傳輸協議(以明文的形式進行傳輸),傳輸效率高,但不安全。 https:由http+ssl(安全套接子層)組成;傳輸之前數據先加密,之後解密獲取內容,傳輸效率低但安全。 HTTP協議之請求 1請求行 2. ...
  • 恢復內容開始 室友最近情緒很不穩定,喜怒無常!就像來大姨夫了一樣的可怕!所以得做好準備!本文幫助你一步步用Python做出自己的情感分析結果,難道你不想試試看? 情感分析不是炫技工具。它是悶聲發大財的方法。早在2010年,就有學者指出,可以依靠Twitter公開信息的情感分析來預測股市的漲落,準確率 ...
  • 在浮點數當中做運算時經常會出現精度丟失的情況,如果做項目不作處理的話會對商家造成很大的影響的。項目尤其是金融相關的項目對這些運算的精度要求較高。 問題原因:首先電腦進行的是二進位運算,我們輸入的十進位數字會先轉換成二進位,進行運算後再轉換為十進位輸出。Float和Double提供了快速的運算,然而 ...
  • 一個合法的身份證號碼由17位地區、日期編號和順序編號加1位校驗碼組成。校驗碼的計算規則如下: 首先對前17位數字加權求和,權重分配為:{7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2};然後將計算的和對11取模得到值Z;最後按照以下關係對應Z值與校驗碼M的值: 現在給定一些身 ...
  • 本篇文章主要介紹泛型的應用。 泛型是.NET Framework 2.0 版類庫就已經提供的語法,主要用於提高代碼的可重用性、類型安全性和效率。 泛型的定義 下麵定義了一個普通類和一個泛型類,我們可以明確看到泛型類和普通類最大的區別就是多了一個<T>。 所以,這個<T>就標記了,這個類是泛型類。其中 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...