用Rust手把手編寫一個Proxy(代理), 動工

来源:https://www.cnblogs.com/luojiawaf/archive/2023/09/19/17713872.html
-Advertisement-
Play Games

用Rust手把手編寫一個Proxy(代理), 動工 項目 ++wmproxy++ gitee 傳送門 github 傳送門 設計流程圖 flowchart LR A[客戶端] -->|Http| B[代理端] --> C[代理服務端] --> D[服務端] B -->|直達| D A -->|Htt ...


用Rust手把手編寫一個Proxy(代理), 動工

項目 ++wmproxy++

gitee 傳送門
github 傳送門

設計流程圖

flowchart LR A[客戶端] -->|Http| B[代理端] --> C[代理服務端] --> D[服務端] B -->|直達| D A -->|Https| B A -->|Socks5| B

代理端和代理服務端之間可用自有格式來實現多路復用以減少連接的建立斷開的開銷,目前暫未實現代理服務端。

類結構

  • proxy.rs 負責代理結構的存儲,監聽類型,監聽地址,是否有父級地址,認證賬號密碼等。
  • flag.rs 監聽類型的二進位結構,可同時支持多結構比較http/https/socks5,如果解析http失敗則嘗試socks5格式,從而實現多種代理方式的同時支持
  • http.rs http及https代理的實現,如果解析失敗則返回ProxyError::Continue,並把已經讀取的數據帶回,以便後續解析
  • socks5.rs socks5的代理實現,如果數據正確,則均在此處進行轉發,解析失敗返回Continue

命令行解析

使用Commander對命令行的的數據處理,如-p 8090,-b 127.0.0.1,完整的命令行如wmproxy -p 8090,則可在8090埠上實現http及https的轉發,代碼示例

let command = Commander::new()
            .version(&env!("CARGO_PKG_VERSION").to_string())
            .usage("-b 127.0.0.1 -p 8090")
            .usage_desc("use http proxy")
            .option_list(
                "-f, --flag [value]",
                "可相容的方法, 如http https socks5",
                None,
            )
            .option_int("-p, --port [value]", "listen port", Some(8090))
            .option_str(
                "-b, --bind [value]",
                "bind addr",
                Some("0.0.0.0".to_string()),
            )
            .parse_env_or_exit();

let listen_port: u16 = command.get_int("p").unwrap() as u16;
let listen_host = command.get_str("b").unwrap();

啟動入口

啟動通過tokio的非同步協議進行數據的處理,邏輯均在tokio::spawn的非同步函數中,所有針對句柄數據的讀取寫入均由非同步完成,從而實現高效率的處理。

while let Ok((mut inbound, _)) = listener.accept().await {
    tokio::spawn(async move {
        // tcp的連接被移動到該協程中,我們只要專註的處理該stream即可
    })
}

HTTP代理

如果該代理信息配置支持http/https則會嘗試進行http解析,代碼實現在proxy.rs中的process方法,

pub async fn process(mut inbound: TcpStream) -> ProxyResult<()> {
    let request = webparse::Request::new();
    // 通過該方法解析標頭是否合法, 若是partial(部分)則繼續讀數據
    // 若解析失敗, 則表示非http協議能處理, 則拋出錯誤
    match request.parse_buffer(&mut buffer.clone()) {
    }
}

該方法會迴圈的讀取客戶端的內容,如果內容為

GET / HTTP/1.1\r\nHost: wwww.baidu.com\r\n\r\n

這表示該請求為普通的http代理,我們解析完HTTP的頭文件信息,得出包含的頭信息,如果無法解析完整的地址(功能變數名稱加埠或者ip加埠),則返回錯誤,無法處理該http信息。

flowchart TD A[客戶端] --> B[代理] --> C[讀取頭信息] --> D[取得地址] -->|成功| E[連接目標地址] -->|成功| F[寫入頭信息] --> G[雙向通道] D -->|不合法關閉| A E -->|連接失敗關閉| A A <-->|雙向| G

註意:客戶端和服務端之前可能會存在大數據上傳下載的情況,超過百兆數據的上傳下載,所以我們為了減少序列化帶來的性能損失和保證在低記憶體能正確運行,不做http的完整解析,僅僅只處理http頭信息。

curl測試

export http_proxy=http://127.0.0.1:8090
curl http://www.baidu.com -I

可以正常的返回

HTTP/1.1 200 OK...

HTTPS代理

https處理是在http的基礎在在額外解析connect協議來實現, 代理是客戶端優先給代理髮送connect協議,比如訪問https://www.baidu.com那麼先優先發如下消息。

CONNECT www.baidu.com:443 HTTP/1.1\r\n
Host: www.baidu.com:443\r\n\r\n

如果收到HTTP的CONNECT的方法則表示他是https的代理協議,那麼此時對PATH提示的地址進行連接,連接成功後只需對該連接和客戶端做雙向綁定即可實現HTTPS代理協議。

curl測試

export https_proxy=http://127.0.0.1:8090
curl https://www.baidu.com -I

可以正常的返回兩次,因為在connect的時候要求代理返回一次數據,另一次是https伺服器返回,故而顯示g

HTTP/1.1 200 OK
HTTP/1.1 200 OK
...

socks5協議

socks5由rfc1928進行定義
代碼實現在socks5.rs中的process方法實現
因為在處理socks5之前可能進行過http的嘗試,所以socket中的內容已經被讀出了一部分,在處理時則帶上了Option<BinaryMut>,表示預讀的內容。
在socks5中通常需要預讀一個位元組來獲取後續的長度,比如NMethod,或者用戶名長度等,所以我們定義了函數

/// 讀取至少長度為size的大小的位元組數, 如果足夠則返回Ok(())
pub async fn read_len<T>(stream: &mut T, buffer: &mut BinaryMut, size: usize) -> ProxyResult<()>
where
    T: AsyncRead + Unpin {
        
    }

這裡的stream用的是泛型,只要具有非同步讀的類型都可以

保證已讀內容須不少於多少位元組數,然後再進行數據的預處理。
根據我們是否傳用用戶密碼信息來確定socks5的驗證方式,如果我們傳入了用戶密碼,如果客戶端不支持2的驗證方式,則返回(0xFF)表示無驗證方法。

curl http://www.baidu.com --socks5 127.0.0.1:8090
## curl: (97) No authentication method was acceptable.

驗證成功或者無需驗證後

graph TD A[驗證成功] --> B[讀取地址] --> C[連接地址] -->|連接成功| D[雙向通道] E[返回失敗] B -->|讀取失敗| E C -->|連接失敗| E A <-->|雙向| D

雙向通道建立後,客戶端已和伺服器能正常的TCP操作,包括Http/Https/Websocket/自定義tcp信息,代理直到一方關閉則正常後續關閉。

錯誤處理方法

這裡主要說明如何多協議相容處理代理協議。以下定義的Continue協議包含了一個已讀的位元組表和當前的Tcp連接。

pub enum ProxyError {
    /// 該錯誤發生協議不可被解析,則嘗試下一個協議
    Continue((Option<BinaryMut>, TcpStream)),
}

例如在http里協議解決頭失敗,

// 此處clone為淺拷貝,不確定是否一定能解析成功,不能影響偏移
match request.parse_buffer(&mut buffer.clone()) {
    Err(_) => {
        return Err(ProxyError::Continue((Some(buffer), inbound)));
    }
}

則返回當前已讀的buffer和tcp連接,且游標為初始位置,buffer並未被讀取過。下個解析器可以拿到完整的數據進行解析。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Redis到底是多線程還是單線程 Redis 6.0版本之前的單線程指的是其網路I/O和鍵值對的讀寫是由一個線程完成的。 多線程在Redis 6.0中的引入是為了改善一些特定場景下的性能問題,特別是在大型多核系統上。Redis 6.0引入了多個I/O線程,這些線程負責處理網路事件的監聽和接收。主線程 ...
  • 基於java圖書商城管理系統設計與實現,網上圖書商城的管理系統,網上商城,線上圖書信息管理系統,上線圖書商城,網上圖書商城,圖書借閱管理系統。 ...
  • 問題回溯 2023年Q2某日運營反饋一個問題,商品系統商家中心某批量工具模板無法下載,導致功能無法使用(因為模板是動態變化的) 商家中心報錯(JSON串): {"code":-1,"msg":"失敗"} 負責的同事看到失敗後立即與我展開討論(因為不是關鍵業務,所以不需要回滾,修複即可),我們發現新功 ...
  • OpenHarmony Meetup 常州站正火熱招募中! 誠邀充滿激情的開發者參與線下盛會~ 探索OpenHarmony前沿科技,暢談未來前景, 感受OpenHarmony生態構建之路的魅力! 線下參與,名額有限,僅限20位幸運者! 報名截止時間為9月26日24:00點,快快行動起來~ 參加Ope ...
  • 一. gcc 安裝 yum install gcc-c++ 安裝 nginx 需要先將官網下載的源碼進行編譯,編譯依賴 gcc 環境,如果沒有 gcc 環境,則需要安裝: cd /etc/yum.repos.d/ sed -i 's/mirrorlist/#mirrorlist/g' /etc/yu ...
  • 基於java高校獎學金管理系統設計與實現,可適用於大學獎學金管理系統,學生獎學金管理系統,學校獎學金,校園獎學金申請管理系統; ...
  • 除了繪製各類分析圖形(比如柱狀圖,折線圖,餅圖等等)以外,matplotlib 也可以在畫布上任意繪製各類幾何圖形。這對於電腦圖形學、幾何演算法和電腦輔助設計等領域非常重要。 matplitlib 中的 patches 類提供了豐富的幾何對象,本篇拋磚引玉,介紹其中幾種常用的幾何圖形繪製方法。 其 ...
  • 截至目前(2023年),Java8發佈至今已有9年,2018年9月25日,Oracle發佈了Java11,這是Java8之後的首個LTS版本。那麼從JDK8到JDK11,到底帶來了哪些特性呢?值得我們升級嗎?而且升級過程會遇到哪些問題呢?帶著這些問題,本篇文章將帶來完整的JDK8升級JDK11最全實... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...