都2019年了，還問GET和POST的區別

摘要：對比GET與POST。 1. 前言最近看了一些同學的面經，發現無論什麼技術崗位，還是會問到 get 和 post 的區別，而搜索出來的答案並不能讓我們裝得一手好逼，那就讓我們從 HTTP 報文的角度來擼一波，從而搞明白他們的區別。 2. 標準答案在開擼之前嗎，讓我們先看一下標準答案長什麼 ...

摘要： 對比GET與POST。

原文：都9102年了，還問GET和POST的區別
作者：程淇銘

Fundebug經授權轉載，版權歸原作者所有。

1. 前言

最近看了一些同學的面經，發現無論什麼技術崗位，還是會問到 get 和 post 的區別，而搜索出來的答案並不能讓我們裝得一手好逼，那就讓我們從 HTTP 報文的角度來擼一波，從而搞明白他們的區別。

2. 標準答案

在開擼之前嗎，讓我們先看一下標準答案長什麼樣子 w3school: GET 對比 POST。標準答案很美好，但是在面試的時候把下麵的表格甩面試官一臉，估計會裝逼不成反被*。

分類	GET	POST
後退按鈕/刷新	無害	數據會被重新提交（瀏覽器應該告知用戶數據會被重新提交）。
書簽	可收藏為書簽	不可收藏為書簽
緩存	能被緩存	不能緩存
編碼類型	application/x-www-form-urlencoded	application/x-www-form-urlencoded 或 multipart/form-data。為二進位數據使用多重編碼。
歷史	參數保留在瀏覽器歷史中。	參數不會保存在瀏覽器歷史中。
對數據長度的限制	是的。當發送數據時，GET 方法向 URL 添加數據；URL 的長度是受限制的（URL 的最大長度是 2048 個字元）。	無限制。
對數據類型的限制	只允許 ASCII 字元。	沒有限制。也允許二進位數據。
安全性	與 POST 相比，GET 的安全性較差，因為所發送的數據是 URL 的一部分。在發送密碼或其他敏感信息時絕不要使用 GET ！	POST 比 GET 更安全，因為參數不會被保存在瀏覽器歷史或 web 伺服器日誌中。
可見性	數據在 URL 中對所有人都是可見的。	數據不會顯示在 URL 中。

註意，並不是說標準答案有誤，上述區別在大部分瀏覽器上是存在的，因為這些瀏覽器實現了 HTTP 標準。

所以從標準上來看，GET 和 POST 的區別如下：

GET 用於獲取信息，是無副作用的，是冪等的，且可緩存
POST 用於修改伺服器上的數據，有副作用，非冪等，不可緩存

但是，既然本文從報文角度來說，那就先不討論 RFC 上的區別，單純從數據角度談談。

3. GET 和 POST 報文上的區別

先下結論，GET 和 POST 方法沒有實質區別，只是報文格式不同。

GET 和 POST 只是 HTTP 協議中兩種請求方式，而 HTTP 協議是基於 TCP/IP 的應用層協議，無論 GET 還是 POST，用的都是同一個傳輸層協議，所以在傳輸上，沒有區別。

報文格式上，不帶參數時，最大區別就是第一行方法名不同

POST方法請求報文第一行是這樣的 POST /uri HTTP/1.1 \r\n

GET方法請求報文第一行是這樣的 GET /uri HTTP/1.1 \r\n

是的，不帶參數時他們的區別就僅僅是報文的前幾個字元不同而已

帶參數時報文的區別呢？在約定中，GET 方法的參數應該放在 url 中，POST 方法參數應該放在 body 中

舉個例子，如果參數是 name=qiming.c, age=22。

GET 方法簡約版報文是這樣的

GET /index.php?name=qiming.c&age=22 HTTP/1.1
Host: localhost

POST 方法簡約版報文是這樣的

POST /index.php HTTP/1.1
Host: localhost
Content-Type: application/x-www-form-urlencoded

name=qiming.c&age=22

現在我們知道了兩種方法本質上是 TCP 連接，沒有差別，也就是說，如果我不按規範來也是可以的。我們可以在 URL 上寫參數，然後方法使用 POST；也可以在 Body 寫參數，然後方法使用 GET。當然，這需要服務端支持。

4. 常見問題

GET 方法參數寫法是固定的嗎？

在約定中，我們的參數是寫在 ? 後面，用 & 分割。

我們知道，解析報文的過程是通過獲取 TCP 數據，用正則等工具從數據中獲取 Header 和 Body，從而提取參數。

也就是說，我們可以自己約定參數的寫法，只要服務端能夠解釋出來就行，一種比較流行的寫法是 http://www.example.com/user/name/chengqm/age/22。

POST 方法比 GET 方法安全？

按照網上大部分文章的解釋，POST 比 GET 安全，因為數據在地址欄上不可見。

然而，從傳輸的角度來說，他們都是不安全的，因為 HTTP 在網路上是明文傳輸的，只要在網路節點上捉包，就能完整地獲取數據報文。

要想安全傳輸，就只有加密，也就是 HTTPS。

GET 方法的長度限制是怎麼回事？

在網上看到很多關於兩者區別的文章都有這一條，提到瀏覽器地址欄輸入的參數是有限的。

首先說明一點，HTTP 協議沒有 Body 和 URL 的長度限制，對 URL 限制的大多是瀏覽器和伺服器的原因。

瀏覽器原因就不說了，伺服器是因為處理長 URL 要消耗比較多的資源，為了性能和安全（防止惡意構造長 URL 來攻擊）考慮，會給 URL 長度加限制。

POST 方法會產生兩個TCP數據包？

有些文章中提到，post 會將 header 和 body 分開發送，先發送 header，服務端返回 100 狀態碼再發送 body。

HTTP 協議中沒有明確說明 POST 會產生兩個 TCP 數據包，而且實際測試(Chrome)發現，header 和 body 不會分開發送。

所以，header 和 body 分開發送是部分瀏覽器或框架的請求方法，不屬於 post 必然行為。

5. talk is cheap show me the code

如果對 get 和 post 報文區別有疑惑，直接起一個 Socket 服務端，然後封裝簡單的 HTTP 處理方法，直接觀察和處理 HTTP 報文，就能一目瞭然

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import socket

HOST, PORT = '', 23333


def server_run():
    listen_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    listen_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
    listen_socket.bind((HOST, PORT))
    listen_socket.listen(1)
    print('Serving HTTP on port %s ...' % PORT)
    while True:
        # 接受連接
        client_connection, client_address = listen_socket.accept()
        handle_request(client_connection)


def handle_request(client_connection):
    # 獲取請求報文
    request = ''
    while True:
        recv_data = client_connection.recv(2400)
        recv_data = recv_data.decode()
        request += recv_data
        if len(recv_data) < 2400:
            break

    # 解析首行
    first_line_array = request.split('\r\n')[0].split(' ')

    # 分離 header 和 body
    space_line_index = request.index('\r\n\r\n')
    header = request[0: space_line_index]
    body = request[space_line_index + 4:]

    # 列印請求報文
    print(request)

    # 返回報文
    http_response = b"""\
HTTP/1.1 200 OK

<!DOCTYPE html>
<html>
<head>
    <title>Hello, World!</title>
</head>
<body>
<p style="color: green">Hello, World!</p>
</body>
</html>
"""
    client_connection.sendall(http_response)
    client_connection.close()


if __name__ == '__main__':
    server_run()

上面代碼就是簡單的列印請求報文然後返回 HelloWorld 的 html 頁面，我們運行起來

[root@chengqm shell]# python httpserver.py 
Serving HTTP on port 23333 ...

然後從瀏覽器中請求看看

列印出來的報文

然後就可以手動證明上述說法，比如說要測試 header 和 body 是否分開傳輸，由於代碼沒有返回 100 狀態碼，如果我們 post 請求成功就說明是一起傳輸的(Chrome/postman)。

又比如 w3school 裡面說 URL 的最大長度是 2048 個字元，那我們在代碼裡面加上一句計算 uri 長度的代碼

...
# 解析首行
first_line_array = request.split('\r\n')[0].split(' ')
print('uri長度: %s' % len(first_line_array[1]))
...

我們用 postman 直接發送超過 2048 個字元的請求看看

然後我們可以得出結論，url 長度限制是某些瀏覽器和伺服器的限制，和 HTTP 協議沒有關係。

到此，我們可以愉快地裝逼了 :)

參考

關於Fundebug

Fundebug專註於JavaScript、微信小程式、微信小游戲、支付寶小程式、React Native、Node.js和Java實時BUG監控。自從2016年雙十一正式上線，Fundebug累計處理了6億+錯誤事件，得到了Google、360、金山軟體等眾多知名用戶的認可。歡迎免費試用！