10. 用Rust手把手編寫一個wmproxy(代理,內網穿透等), HTTP內網穿透支持修改頭信息

来源:https://www.cnblogs.com/luojiawaf/archive/2023/10/10/17753852.html
-Advertisement-
Play Games

用Rust手把手編寫一個wmproxy(代理,內網穿透等), HTTP內網穿透支持修改頭信息項目 涉及HTTP1.1 chunked, http2, keep-alive ...


用Rust手把手編寫一個wmproxy(代理,內網穿透等), HTTP內網穿透支持修改頭信息

項目 ++wmproxy++

gite: https://gitee.com/tickbh/wmproxy

github: https://github.com/tickbh/wmproxy

修改header參數

但凡代理之類,基本上都有修改頭參數的需求,就比如要獲取客戶端的真實IP,需要寫入x-forward-for表示客戶端的真實IP,要不然經過轉發後的HTTP無法獲取真實的客戶端地址。

所以需要在轉發的同時能進行處理頭部信息的相關參數。故內網端不能僅做流量轉發。而且客戶端可能直接以純HTTP2的協議請求內網的數據,所以同時需要支持HTTP/1.1及HTTP2,由於以上需求,我們把之前的簡單的轉發邏輯改成以服務端接收客戶端請求的模式對數據進行重加工。

新流程如下

以下是數據從外網進入到內網伺服器的加工流程

graph TD A[外網客戶端] B[代理服務端-外網] C[請求端] D[新的請求端] E[代理客戶端--內網] F[內網伺服器] A-->|請求http埠| B B -->|解析成Request| C C -->|修改Request中的Header|D D -->|發送HTTP請求數據給CenterClient|E E -->|請求內網伺服器轉發數據|F

以下是內網伺服器返回數據給外網客戶端的流程

graph TD A[外網客戶端] B[代理服務端-外網] C[新的返回端] D[返回端] E[代理客戶端--內網] F[內網伺服器] F -->|返回Response|E E -->|發送HTTP數據給CenterServer|D D -->|修改頭信息加工|C C -->|將數據轉發給|B B -->|返回數據|A

轉發中的註意事項

我們可以獲取完整的Request再進行請求嗎?

如果我們這麼操作,當數據包非常的大的時候例如1G,我們此時在記憶體中將有完整的1G記憶體,那麼此時只需有數個同一類的請求,將會耗盡我們的記憶體,所以我們必須不能這麼處理。

超大文件下載的轉發

超大文件必須將得到的數據及時的轉發給客戶端,此時在記憶體中的值才不至於太大,又能及時的傳輸給客戶端,要不然可能大文件下載到中轉伺服器的時間內客戶端得不到任何數據就會空耗掉這時間。

http/1.1中的chunked的處理

因為http/1.1的chunked協議,由RFC 2616定義,

分塊編碼(Transfer-Encoding: chunked)是超文本傳輸協議(HTTP)中的一種數據傳輸機制,允許HTTP由網頁伺服器發送給客戶端的數據可以分成多個部分。分塊傳輸編碼只在HTTP協議1.1版本(HTTP/1.1)中提供,如果頭部中有該選項,則代表數據包是chunked格式。
數據分解成一系列數據塊,並以一個或多個塊發送,這樣伺服器可以發送數據而不需要預先知道發送內容的總大小。

比如我們常看到的

for data in res.chunk() {
}

就是表示的是數據分段接收,對於大數據這個尤為重要。

此種報文的示例
這時,報文中的實體需要改為用一系列分塊來傳輸。
每個分塊包含十六進位的長度值和數據,長度值獨占一行,長度不包括它結尾的 CRLF(\r\n),也不包括分塊數據結尾的 CRLF。
最後一個分塊長度值必須為 0,對應的分塊數據沒有內容,表示實體結束。
例:

HTTP/1.1 200 OK
Content-Type: text/plain
Transfer-Encoding: chunked

a\r\n
01234567890\r\n
1e\r\n
wmproxy is very good nat tool\r\n
0\r\n
\r\n

此種報文中我們必須進行解析,因為客戶端可能是keep-alive選項,可以連續進行多發。所以收到的Request和Response都是連續的。必須知道何處結束才能繼續解析下一個Request/Response。http2不需要,因為http2自帶的data分包機制就有這些數據的處理

header數據的定義

  • header的修改分為兩部分,一部分是對請求Request的重寫,另一部分是對返回Response的重寫。所以我們必須同時支持這兩種,且將其區分出來。每條header信息我們將定定義一個可變長的數組,如第一個字元為proxy則表示對Request修改。
  • 關於修改的動作有
    1. 添加,如x-forward-for需要末尾添加,我們用操作符+,比如[proxy, +, x-forward-for, $client_ip]
    2. 刪除,我們用操作符+,如[-, hidden]
    3. 設置,設置我們預設不做任何參數,直接以header_name開頭,如[custom-key, custom-value]
    4. 預設值,有些值有了參數我們就不將其重寫,如果沒有我們則設為預設值,我們用操作符?,如[?, server, wmproxy]

所以我們client.yaml的配置新增至如下:

# 連接服務端地址
server: 127.0.0.1:8091
# 連接服務端是否加密
ts: true

# 內網映射配置的數組
mappings:
  #將localhost的功能變數名稱轉發到本地的127.0.0.1:8080
  - name: web
    mode: http
    local_addr: 127.0.0.1:8080
    domain: localhost
    headers:
      - [proxy, +, x-forward-for, $client_ip]
      - [-, hidden]
      - [custom-key, custom-value]
      - [?, server, wmproxy]

mappings的結構修改

pub struct MappingConfig {
    pub name: String,
    pub mode: String,
    pub local_addr: Option<SocketAddr>,
    #[serde(default = "default_domain")]
    pub domain: String,
    #[serde(default = "default_header")]
    pub headers: Vec<Vec<String>>,
}

我們把headers定義成一個動態的數組。根據不同的類型做不同的數據,因為長度有變化所以做不定長參數。
以下是代碼解析

pub fn parse<T: Buf>(header: ProtFrameHeader, mut buf: T) -> ProxyResult<ProtMapping> {
    must_have!(buf, 2)?;
    let len = buf.get_u16() as usize;
    let mut mappings = vec![];
    
    for _ in 0..len {
        let name = read_short_string(&mut buf)?;
        let mode = read_short_string(&mut buf)?;
        let domain = read_short_string(&mut buf)?;
        let mut headers = vec![];
        must_have!(buf, 2)?;
        let len = buf.get_u16();
        for _ in 0 .. len {
            let mut header = vec![];
            must_have!(buf, 1)?;
            let sub_len = buf.get_u8();
            for _ in 0..sub_len {
                header.push(read_short_string(&mut buf)?);
            }
            headers.push(header);
        }
        mappings.push(MappingConfig::new(name, mode, domain, headers));
    }
    Ok(ProtMapping {
        sock_map: header.sock_map(),
        mappings,
    })
}

如此解析成一個完整的對應功能變數名稱的結構,因為服務端用不到local_addr所以不做傳輸。

核心代碼的實現

核心處理代碼在trans/http.rs下,外部傳入一個可讀可寫的stream,可能是TcpStream也可能是TlsStream<TcpStream>或者其它,同時把接收的SocketAddr傳入,以方便後續獲取$client_ip的頭文件信息。

預處理

pub async fn process<T>(self, inbound: T, addr: SocketAddr) -> Result<(), ProxyError<T>>
where
    T: AsyncRead + AsyncWrite + Unpin + Debug,
{
    println!("new process {:?}", inbound);
    let build = Client::builder();
    let (virtual_sender, virtual_receiver) = channel::<ProtFrame>(10);
    let stream = VirtualStream::new(self.sock_map, self.sender.clone(), virtual_receiver);
    let mut client = Client::new(build.value().ok().unwrap(), stream);
    let (receiver, sender) = client.split().unwrap();
    let oper = HttpOper {
        receiver,
        sender,
        sender_work: self.sender_work.clone(),
        virtual_sender: Some(virtual_sender),
        sock_map: self.sock_map,
        mappings: self.mappings.clone(),
        http_map: None,
    };
    let mut server = Server::new(inbound, Some(addr), oper);
    tokio::spawn( async move {
        let _ = client.wait_operate().await;
    });
    let _ret = server.incoming(Self::operate).await;
    if _ret.is_err() {
        println!("ret = {:?}", _ret);
    }
    Ok(())
}

此時我們創建一個虛擬的Stream來做雙邊互傳,但是此時我們還沒有收到任何的Request請求,我們並不知道當前的Host,此時我們還未發送ProtCreate,等真正處理請求的時候做處理,HttpOper是處理每個操作時均會帶的參數,我們可以根據自己需要帶上該參數。

後續處理,其中我們讀和寫都用RecvStream,做到讀多少數據轉發多少數據,以保證數據處理的及時性

async fn inner_operate(
    mut req: Request<RecvStream>,
    data: Arc<Mutex<HttpOper>>,
) -> ProtResult<Option<Response<RecvStream>>> {
    println!("receiver req = {:?}", req.url());
    let mut value = data.lock().await;
    let sender = value.virtual_sender.take();
    // 傳在該參數則為第一次, 第一次的時候發送Create創建綁定連接
    if sender.is_some() {
        let host_name = req.get_host().unwrap_or(String::new());
        // 取得相關的host數據,對內網的映射端做匹配,如果未匹配到返回錯誤,表示不支持
        {
            let mut config = None;
            let mut is_find = false;
            {
                let read = value.mappings.read().await;
                for v in &*read {
                    if v.domain == host_name {
                        is_find = true;
                        config = Some(v.clone());
                    }
                }
            }
            if !is_find {
                return Ok(Some(Response::builder().status(404).body("not found").ok().unwrap().into_type()));
            }
            value.http_map = config;
        }

        println!("do create prot {}, host = {:?}", value.sock_map, req.get_host());

        let create = ProtCreate::new(value.sock_map, Some(req.get_host().unwrap_or(String::new())));
        let _ = value.sender_work.send((create, sender.unwrap())).await;
    }

    if let Some(config) = &value.http_map {
        // 覆寫Request的頭文件信息
        HeaderHelper::rewrite_request(&mut req, &config.headers);
    }

    // 將請求發送出去
    value.sender.send(req).await?;
    // 等待返回數據的到來
    let mut res = value.receiver.recv().await;
    if res.is_some() {
        if let Some(config) = &value.http_map {
            // 覆寫Response的頭文件信息
            HeaderHelper::rewrite_response(res.as_mut().unwrap(), &config.headers);
        }
        return Ok(res);
    } else {
        return Ok(Some(Response::builder().status(503).body("cant trans").ok().unwrap().into_type()));
    }
}

以下是直接HTTP/1.1的請求示例

以下是直接HTTP/1.1升級成HTTP2的請求示例

以下是直接HTTP2的請求示例

請求的返回結果均帶上了添加的頭部信息,測試正常,至此HTTP的內網穿透數據打通。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • C++ Windows下使用Cmake編譯Poco庫 1.編譯前準備: 先配置OpenSSL環境 (openssl version -a查看) 如果openssl是1.0.*版本,Poco版本最高用1.9.4。 如果1.1或者更高,用最新版本。 2.編譯命令(演示使用VS2022編譯v140版本Wi ...
  • 對於rpc項目,在接受大佬指導的時候曾問過對於長連接和短連接是處理處理的,在面試的時候也被問起socket是長連接還是短連接,發現自己沒有好好思考過這個問題,因此好好總結一下。 前置知識點:rpc基礎,tcp基礎 rpc項目中的長連接與短連接的思考 什麼是rpc項目中的長連接和短連接 類似於http ...
  • 4.1 環境搭建 創建名為spring_mvc_demo2的新module,過程參考3.1節 4.1.1、創建請求控制器 package org.rain.controller; import org.springframework.stereotype.Controller; /** * @aut ...
  • 一、當你擁有一個excel版的介面用例 excel中有用例名稱、url、請求方式和請求參數 二、獲取excel的Url、請求方式和請求參數 # 單獨獲取某個單元格的值,第二行第二列# 第二行數據 row代表行,column代表列# url=sh.cell(row=2,column=2).value# ...
  • 看到一篇 IDEA 快捷鍵的總結,非常全面,分享一下。 本文參考了 IntelliJ IDEA 的官網,列舉了IntelliJ IDEA(Windows 版)的所有快捷鍵。併在此基礎上,為 90% 以上的快捷鍵提供了動圖演示,能夠直觀的看到操作效果。 該快捷鍵共分 16 種,可以方便的按各類查找自己 ...
  • 本文深入探討了Go語言中通道(Channel)的各個方面,從基礎概念到高級應用。文章詳細解析了通道的類型、操作方法以及垃圾回收機制,更進一步通過具體代碼示例展示了通道在數據流處理、任務調度和狀態監控等多個實際應用場景中的作用。本文旨在為讀者提供一個全面而深入的理解,以更有效地使用Go中的通道進行併發 ...
  • 堆疊柱狀圖,是一種用來分解整體、比較各部分的圖。與柱狀圖類似,堆疊柱狀圖常被用於比較不同類別的數值。而且,它的每一類數值內部,又被劃分為多個子類別,這些子類別一般用不同的顏色來指代。 柱狀圖幫助我們觀察“總量”,堆疊柱狀圖則可以同時反映“總量”與“結構”。也就是說,堆疊柱狀圖不僅可以反映總量是多少? ...
  • 目錄XXLJob簡介特性模塊安裝調度中心初始化資料庫配置啟動整合執行器pomymlXxlJobConfig啟動執行器實踐簡單的定時任務在執行器創建任務在調度中心創建執行器在調度中心創建任務帶前置和後置處理的定時任務XxlJob註解詳解創建帶前(後)置處理的任務父子任務父子執行器關聯父子任務執行器側l ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...