HTTP GET/POST 請求時，空格應該編碼為 %20 還是 +？

-Advertisement-

URI 規範和 W3C 規範衝突了，才會搞出這種讓人疑惑的烏龍事件 ...

「靈異」的空格

1.`%20` 還是 `+` ？

這個是個史詩級的大坑，我曾經被這個協議衝突坑了一天。

開始講解前先看個小測試，在瀏覽器里輸入 blank test（ blank 和 test 間有個空格），我們看看瀏覽器如何處理的：

從動圖可以看出瀏覽器把空格解析為一個加號「+」。

是不是感覺有些奇怪？我們再做個測試，用瀏覽器提供的幾個函數試一下：

encodeURIComponent("blank test") // "blank%20test"
encodeURI("q=blank test")        // "q=blank%20test"
new URLSearchParams("q=blank test").toString() // "q=blank+test"

代碼是不會說謊的，其實上面的結果都是正確的，encode 結果不一樣，是因為 URI 規範和 W3C 規範衝突了，才會搞出這種讓人疑惑的烏龍事件。

2.衝突的協議

我們首先看看 URI 中的保留字，這些保留字不參與編碼。保留字元一共有兩大類：

gen-delims：: / ? # [ ] @
sub-delims：! $ & ' ( ) * + , ; =

URI 的編碼規則也很簡單，先把非限定範圍的字元轉為 16 進位，然後前面加百分號。

空格這種不安全字元轉為十六進位就是 0x20，前面再加上百分號 % 就是 %20：

所以這時候再看 encodeURIComponent 和 encodeURI 的編碼結果，就是完全正確的。

既然空格轉為%20 是正確的，那轉為 + 是怎麼回事？這時候我們就要瞭解一下 HTML form 表單的歷史。

早期的網頁沒有 AJAX 的時候，提交數據都是通過 HTML 的 form 表單。form 表單的提交方法可以用 GET 也可以用 POST，大家可以在 MDN form 詞條上測試：

經過測試我們可以看出表單提交的內容中，空格都是轉為加號的，這種編碼類型就是 application/x-www-form-urlencoded，在 WHATWG 規範里是這樣定義的：

到這裡基本上就破案了，URLSearchParams 做 encode 的時候，就按這個規範來的。我找到了 URLSearchParams 的 Polyfill 代碼，裡面就做了 %20 到 + 的映射：

replace = {
    '!': '%21',
    "'": '%27',
    '(': '%28',
    ')': '%29',
    '~': '%7E',
    '%20': '+', // <= 就是這個
    '%00': '\x00'
}

規範里對這個編碼類型還有解釋說明：

The application/x-www-form-urlencoded format is in many ways an aberrant monstrosity, the result of many years of implementation accidents and compromises leading to a set of requirements necessary for interoperability, but in no way representing good design practices. In particular, readers are cautioned to pay close attention to the twisted details involving repeated (and in some cases nested) conversions between character encodings and byte sequences. Unfortunately the format is in widespread use due to the prevalence of HTML forms.

這種編碼方式就不是個好的設計，不幸的是隨著 HTML form 表單的普及，這種格式已經推廣開了

其實上面一大段句話就是一個意思：這玩意兒設計的就是

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

巧用 display: contents 增強頁面語義

display: contents 是一個比較陌生的屬性，雖然屬於 display 這個基本上是最常見的 CSS 屬性，但是 contents 這個取值基本不會用到。但是它早在 2016 年就已經得到了 Firefox 的支持。本文將深入一下這個有意思的屬性值。基本用法根據 W3C 對 dis ...
JavaScript中的高階函數

前言在 JavaScript 的學習過程中，我們可能或多或少地接觸過高階函數。那麼，我們自己對此是否有一個明確的定義，或者說很熟練的掌握這些用法呢簡單來說，高階函數是一個函數，它接收函數作為參數或將函數作為輸出返回看到這樣的概念，在你的腦海中會出現哪些函數呢其實，像我們經常會使用到的一些數組 ...
Js--使用sort根據數組中對象的某一個屬性值進行排序

Js--使用sort根據數組中對象的某一個屬性值進行排序博客說明文章所涉及的資料來自互聯網整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯繫本人刪除，謝謝！說明在開發的時候時常會遇到這樣的問題思路 c = [{create_time: "Mon, 25 May 2020 0 ...
Js--將兩個數組合併

Js--將兩個數組合併博客說明文章所涉及的資料來自互聯網整理和個人總結，意在於個人學習和經驗彙總，如有什麼地方侵權，請聯繫本人刪除，謝謝！方法一使用concat var a = [1,2,3]; var b = [4,5,6]; var c = a.concat(b); //c=[1,2,3 ...
HTTP 規範中的那些暗坑

HTTP 雖然有諸多的優點，但是在協議定義時因為諸多的博弈和限制，還是隱藏了不少暗坑，讓人一不小心就會陷入其中。本文總結了 HTTP 規範中常見的幾個暗坑，希望大家開發中有意識的規避它們，提升開發體驗。 ...
面試題：什麼是Event Loop？

參見阮一峰的這篇，比較清晰，比其他二手的說得更清楚 http://www.ruanyifeng.com/blog/2013/10/event_loop.html ...
# 2.響應式原理

# 2.響應式原理 - 響應式具有的特點 1.網頁寬度自動調整 2.儘量少用絕對寬度 3.字體要使用rem、em作為單位 4.佈局要使用浮動或者彈性佈局響應式下任何東西都要隨著屏幕的尺寸改變而改變不能使用絕對大小 - 媒體查詢根據一個或多個基於設備類型、具體特點和環境來應用樣式 @media @ ...
面試題：從“在瀏覽器輸入功能變數名稱”到“頁面靜態資源完全載入”的整個流程

...

HTTP GET/POST 請求時，空格應該編碼為 %20 還是 +？

「靈異」的空格

1.%20 還是 + ？

2.衝突的協議

1.`%20` 還是 `+` ？