摘要: 對比GET與POST。 1. 前言 最近看了一些同學的面經,發現無論什麼技術崗位,還是會問到 get 和 post 的區別,而搜索出來的答案並不能讓我們裝得一手好逼,那就讓我們從 HTTP 報文的角度來擼一波,從而搞明白他們的區別。 2. 標準答案 在開擼之前嗎,讓我們先看一下標準答案長什麼 ...
摘要: 對比GET與POST。
- 原文:都9102年了,還問GET和POST的區別
- 作者:程淇銘
Fundebug經授權轉載,版權歸原作者所有。
1. 前言
最近看了一些同學的面經,發現無論什麼技術崗位,還是會問到 get 和 post 的區別,而搜索出來的答案並不能讓我們裝得一手好逼,那就讓我們從 HTTP 報文的角度來擼一波,從而搞明白他們的區別。
2. 標準答案
在開擼之前嗎,讓我們先看一下標準答案長什麼樣子 w3school: GET 對比 POST。標準答案很美好,但是在面試的時候把下麵的表格甩面試官一臉,估計會裝逼不成反被*。
分類 | GET | POST |
---|---|---|
後退按鈕/刷新 | 無害 | 數據會被重新提交(瀏覽器應該告知用戶數據會被重新提交)。 |
書簽 | 可收藏為書簽 | 不可收藏為書簽 |
緩存 | 能被緩存 | 不能緩存 |
編碼類型 | application/x-www-form-urlencoded | application/x-www-form-urlencoded 或 multipart/form-data。為二進位數據使用多重編碼。 |
歷史 | 參數保留在瀏覽器歷史中。 | 參數不會保存在瀏覽器歷史中。 |
對數據長度的限制 | 是的。當發送數據時,GET 方法向 URL 添加數據;URL 的長度是受限制的(URL 的最大長度是 2048 個字元)。 | 無限制。 |
對數據類型的限制 | 只允許 ASCII 字元。 | 沒有限制。也允許二進位數據。 |
安全性 | 與 POST 相比,GET 的安全性較差,因為所發送的數據是 URL 的一部分。在發送密碼或其他敏感信息時絕不要使用 GET ! | POST 比 GET 更安全,因為參數不會被保存在瀏覽器歷史或 web 伺服器日誌中。 |
可見性 | 數據在 URL 中對所有人都是可見的。 | 數據不會顯示在 URL 中。 |
註意,並不是說標準答案有誤,上述區別在大部分瀏覽器上是存在的,因為這些瀏覽器實現了 HTTP 標準。
所以從標準上來看,GET 和 POST 的區別如下:
- GET 用於獲取信息,是無副作用的,是冪等的,且可緩存
- POST 用於修改伺服器上的數據,有副作用,非冪等,不可緩存
但是,既然本文從報文角度來說,那就先不討論 RFC 上的區別,單純從數據角度談談。
3. GET 和 POST 報文上的區別
先下結論,GET 和 POST 方法沒有實質區別,只是報文格式不同。
GET 和 POST 只是 HTTP 協議中兩種請求方式,而 HTTP 協議是基於 TCP/IP 的應用層協議,無論 GET 還是 POST,用的都是同一個傳輸層協議,所以在傳輸上,沒有區別。
報文格式上,不帶參數時,最大區別就是第一行方法名不同
POST方法請求報文第一行是這樣的 POST /uri HTTP/1.1 \r\n
GET方法請求報文第一行是這樣的 GET /uri HTTP/1.1 \r\n
是的,不帶參數時他們的區別就僅僅是報文的前幾個字元不同而已
帶參數時報文的區別呢? 在約定中,GET 方法的參數應該放在 url 中,POST 方法參數應該放在 body 中
舉個例子,如果參數是 name=qiming.c, age=22。
GET 方法簡約版報文是這樣的
GET /index.php?name=qiming.c&age=22 HTTP/1.1
Host: localhost
POST 方法簡約版報文是這樣的
POST /index.php HTTP/1.1
Host: localhost
Content-Type: application/x-www-form-urlencoded
name=qiming.c&age=22
現在我們知道了兩種方法本質上是 TCP 連接,沒有差別,也就是說,如果我不按規範來也是可以的。我們可以在 URL 上寫參數,然後方法使用 POST;也可以在 Body 寫參數,然後方法使用 GET。當然,這需要服務端支持。
4. 常見問題
GET 方法參數寫法是固定的嗎?
在約定中,我們的參數是寫在 ?
後面,用 &
分割。
我們知道,解析報文的過程是通過獲取 TCP 數據,用正則等工具從數據中獲取 Header 和 Body,從而提取參數。
也就是說,我們可以自己約定參數的寫法,只要服務端能夠解釋出來就行,一種比較流行的寫法是 http://www.example.com/user/name/chengqm/age/22
。
POST 方法比 GET 方法安全?
按照網上大部分文章的解釋,POST 比 GET 安全,因為數據在地址欄上不可見。
然而,從傳輸的角度來說,他們都是不安全的,因為 HTTP 在網路上是明文傳輸的,只要在網路節點上捉包,就能完整地獲取數據報文。
要想安全傳輸,就只有加密,也就是 HTTPS。
GET 方法的長度限制是怎麼回事?
在網上看到很多關於兩者區別的文章都有這一條,提到瀏覽器地址欄輸入的參數是有限的。
首先說明一點,HTTP 協議沒有 Body 和 URL 的長度限制,對 URL 限制的大多是瀏覽器和伺服器的原因。
瀏覽器原因就不說了,伺服器是因為處理長 URL 要消耗比較多的資源,為了性能和安全(防止惡意構造長 URL 來攻擊)考慮,會給 URL 長度加限制。
POST 方法會產生兩個TCP數據包?
有些文章中提到,post 會將 header 和 body 分開發送,先發送 header,服務端返回 100 狀態碼再發送 body。
HTTP 協議中沒有明確說明 POST 會產生兩個 TCP 數據包,而且實際測試(Chrome)發現,header 和 body 不會分開發送。
所以,header 和 body 分開發送是部分瀏覽器或框架的請求方法,不屬於 post 必然行為。
5. talk is cheap show me the code
如果對 get 和 post 報文區別有疑惑,直接起一個 Socket 服務端,然後封裝簡單的 HTTP 處理方法,直接觀察和處理 HTTP 報文,就能一目瞭然
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import socket
HOST, PORT = '', 23333
def server_run():
listen_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
listen_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
listen_socket.bind((HOST, PORT))
listen_socket.listen(1)
print('Serving HTTP on port %s ...' % PORT)
while True:
# 接受連接
client_connection, client_address = listen_socket.accept()
handle_request(client_connection)
def handle_request(client_connection):
# 獲取請求報文
request = ''
while True:
recv_data = client_connection.recv(2400)
recv_data = recv_data.decode()
request += recv_data
if len(recv_data) < 2400:
break
# 解析首行
first_line_array = request.split('\r\n')[0].split(' ')
# 分離 header 和 body
space_line_index = request.index('\r\n\r\n')
header = request[0: space_line_index]
body = request[space_line_index + 4:]
# 列印請求報文
print(request)
# 返回報文
http_response = b"""\
HTTP/1.1 200 OK
<!DOCTYPE html>
<html>
<head>
<title>Hello, World!</title>
</head>
<body>
<p style="color: green">Hello, World!</p>
</body>
</html>
"""
client_connection.sendall(http_response)
client_connection.close()
if __name__ == '__main__':
server_run()
上面代碼就是簡單的列印請求報文然後返回 HelloWorld 的 html 頁面,我們運行起來
[root@chengqm shell]# python httpserver.py
Serving HTTP on port 23333 ...
然後從瀏覽器中請求看看
列印出來的報文
然後就可以手動證明上述說法,比如說要測試 header 和 body 是否分開傳輸,由於代碼沒有返回 100 狀態碼,如果我們 post 請求成功就說明是一起傳輸的(Chrome/postman)。
又比如 w3school 裡面說 URL 的最大長度是 2048 個字元,那我們在代碼裡面加上一句計算 uri 長度的代碼
...
# 解析首行
first_line_array = request.split('\r\n')[0].split(' ')
print('uri長度: %s' % len(first_line_array[1]))
...
我們用 postman 直接發送超過 2048 個字元的請求看看
然後我們可以得出結論,url 長度限制是某些瀏覽器和伺服器的限制,和 HTTP 協議沒有關係。
到此,我們可以愉快地裝逼了 :)
參考
- 99%的人都理解錯了HTTP中GET與POST的區別
- 關於HTTP GET 和 POST
- w3school: HTTP 方法:GET 對比 POST
- wikipedia: 超文本傳輸協議
- RFC 2068
關於Fundebug
Fundebug專註於JavaScript、微信小程式、微信小游戲、支付寶小程式、React Native、Node.js和Java實時BUG監控。 自從2016年雙十一正式上線,Fundebug累計處理了6億+錯誤事件,得到了Google、360、金山軟體等眾多知名用戶的認可。歡迎免費試用!