Atitit. http 代理原理 atiHttpProxy 大木馬 1. 面這張圖可以清晰地闡明HttpProxy的實現原理:1 2. 代理伺服器用途1 3. 其中流程具體如下:2 4. 設計規劃3 5. 結束語4 1. 面這張圖可以清晰地闡明HttpProxy的實現原理: 2. 代理伺服器用途 ...
Atitit. http 代理原理 atiHttpProxy 大木馬
1. 面這張圖可以清晰地闡明HttpProxy的實現原理:1
1. 面這張圖可以清晰地闡明HttpProxy的實現原理:
2. 代理伺服器用途
代理伺服器看成是一種擴展瀏覽器功能的途徑。例如,在把數據發送給瀏覽器之前,可以用代理伺服器壓縮數據
調試器
數據搜集器
木馬病毒
3. 其中流程具體如下:
1、客戶端通過瀏覽器向代理伺服器發送HttpRequest(GET/POST);
2、代理伺服器讀取請求頭,抽取出請求的具體目標伺服器HOST和PORT;
3、代理伺服器把請求頭髮送給目標伺服器;
4、代理伺服器建立管道,供客戶端和目標伺服器通過兩個Socket通信。
不管以哪種方式應用代理伺服器,其監控HTTP傳輸的過程總是如下:
· 步驟一:內部的瀏覽器發送請求給代理伺服器。請求的第一行包含了目標URL。
· 步驟二:代理伺服器讀取該URL,並把請求轉發給合適的目標伺服器。
· 步驟三:代理伺服器接收來自Internet目標機器的應答,把應答轉發給合適的內部瀏覽器。
例如,假設有一個企業的雇員試圖訪問www.cn.ibm.com網站。如果沒有代理伺服器,雇員的瀏覽器打開的Socket通向運行這個網站的Web服 務器,從Web伺服器返回的數據也直接傳遞給雇員的瀏覽器。如果瀏覽器被配置成使用代理伺服器,則請求首先到達代理伺服器;隨後,代理伺服器從請求的第一 行提取目標URL,打開一個通向www.cn.ibm.com的Socket。當www.cn.ibm.com返回應答時,代理伺服器把應答轉發給雇員的 瀏覽器。
當然,代理伺服器並非只適用於企業環境。作為一個開發者,擁有一個自己的代理伺服器是一件很不錯的事情。例如,我們可以用代理伺服器來分析瀏覽器和Web 伺服器的交互過程。測試和解決Web應用中存在的問題時,這種功能是很有用的。我們甚至還可以同時使用多個代理伺服器(大多數代理伺服器允許多個伺服器鏈 接在一起使用)。例如,我們可以有一個企業的代理伺服器,再加上一個用Java編寫的代理伺服器,用來調試應用程式。但應該註意的是,代理伺服器鏈上的每 一個伺服器都會對性能產生一定的影響。
4. 設計規劃
正如其名字所示,代理伺服器只不過是一種特殊的伺服器。和大多數伺服器一樣,如果要處理多個請求,代理伺服器應該使用線程。下麵是一個代理伺服器的基本規劃:
1. 等待來自客戶(Web瀏覽器)的請求。
2. 啟動一個新的線程,以處理客戶連接請求。
3. 讀取瀏覽器請求的第一行(該行內容包含了請求的目標URL)。
4. 分析請求的第一行內容,得到目標伺服器的名字和埠。
5. 打開一個通向目標伺服器(或下一個代理伺服器,如合適的話)的Socket。
6. 把請求的第一行發送到輸出Socket。
7. 把請求的剩餘部分發送到輸出Socket。
8. 把目標Web伺服器返回的數據發送給發出請求的瀏覽器。
當然,如果考慮細節的話,情況會更複雜一些。實際上,這裡主要有兩個問題要考慮:第一,從Socket按行讀取數據最適合進一步處理,但這會產生性能瓶 頸;第二,兩個Socket之間的連接必需高效。有幾種方法可以實現這兩個目標,但每一種方法都有各自的代價。例如,如果要在數據進入的時候進行過濾,這 些數據最好按行讀取;然而,大多數時候,當數據到達代理伺服器時,立即把它轉發出去更適合高效這一要求。另外,數據的發送和接收也可以使用多個獨立的線 程,但大量地創建和拆除線程也會帶來性能問題。因此,對於每一個請求,我們將用一個線程處理數據的接收和發送,同時在數據到達代理伺服器時,儘可能快速地 把它轉發出去。
當代理伺服器連接到Web伺服器之後,我用一個簡單的迴圈在兩個Socket之間傳遞數據。這裡可能出現一個問題,即如果沒有可操作的數據,調用read 方法可能導致程式阻塞,從而掛起程式。為防止出現這個問題,我用setSoTimeout方法設置了Socket的超時時間(參見Listing 2)。這樣,如果某個Socket不可用,另一個仍舊有機會進行處理,我不必創建一個新的線程。
和所有線程對象一樣,HttpProxy類的主要工作在run方法內完成(見Listing 2)。run方法實現了一個簡單的狀態機,從Web瀏覽器每次一個讀取字元,持續這個過程直至有足夠的信息找出目標Web伺服器。然後,run打開一個通 向該Web伺服器的Socket(如果有多個代理伺服器被鏈接在一起,則run方法打開一個通向鏈裡面下一個代理伺服器的Socket)。打開 Socket之後,run先把部分的請求寫入Socket,然後調用pipe方法。pipe方法直接在兩個Socket之間以最快的速度執行讀寫操作。
如果數據規模很大,另外創建一個線程可能具有更高的效率;然而,當數據規模較小時,創建新線程所需要的開銷會抵消它帶來的好處。
Listing 3顯示了一個很簡單的main方法,可以用來測試HttpProxy類。大部分的工作由一個靜態的startProxy方法完成(見Listing 4)。這個方法用到了一種特殊的技術,允許一個靜態成員創建HttpProxy類(或HttpProxy類的子類)的實例。它的基本思想是:把一個 Class對象傳遞給startProxy類;然後,startProxy方法利用映像API(Reflection API)和getDeclaredConstructor方法確定該Class對象的哪一個構造函數接受一個Socket參數;最 後,startProxy方法調用newInstance方法創建該Class對象。
利用這種技術,我們可以在不創建startProxy方法定製版本的情況下,擴展HttpProxy類。要得到給定類的Class對象,只需在正常的名字 後面加上.class(如果有某個對象的一個實例,則代之以調用getClass方法)。由於我們把Class對象傳遞給了startProxy方法,所 以創建HttpProxy的派生類時,就不必再特意去修改startProxy。(下載代碼中包含了一個派生得到的簡單代理伺服器)。
5. 結束語
利用派生類定製或調整代理伺服器的行為有兩種途徑:修改主機的名字,或者捕獲所有通過代理伺服器的數據。processHostName方法允許代理服務 器分析和修改主機名字。如果啟用了日誌記錄,代理伺服器為每一個通過伺服器的字元調用writeLog方法。如何處理這些信息完全由我們自己決定――可以 把它寫入日誌文件,可以把它輸出到控制台,或進行任何其他滿足我們要求的處理。writeLog輸出中的一個Boolean標記指示出數據是來自瀏覽器還 是Web主機。
和許多工具一樣,代理伺服器本身並不存在好或者壞的問題,關鍵在於如何使用它們。代理伺服器可能被用於侵犯隱私,但也可以阻隔偷窺者和保護網路。即使代理 伺服器和瀏覽器不在同一臺機器上,我也樂意把代理伺服器看成是一種擴展瀏覽器功能的途徑。例如,在把數據發送給瀏覽器之前,可以用代理伺服器壓縮數據;未 來的代理伺服器甚至還可能把頁面從一種語言翻譯成另一種語言……可能性永無止境。
多線程Http代理伺服器 Java實現 - 獨上高樓 - ITeye技術網站.htm
用Java開發代理伺服器.htm