今天小微開店寶在測試環境發佈更新的時候,同事問:“**為什麼我需要手動清理瀏覽器緩存才能看到變更?難道系統上線後也需要客戶自己清理瀏覽器緩存嗎!”看來,這個坑需要我來填了。 ...
今天小微開店寶在測試環境發佈更新的時候,同事問:“為什麼我需要手動清理瀏覽器緩存才能看到變更?難道系統上線後也需要客戶自己清理瀏覽器緩存嗎!”看來,這個坑需要我來填了。
什麼是瀏覽器緩存
瀏覽器緩存(Brower Caching)
是瀏覽器在本地磁碟對用戶最近請求過的文檔進行存儲,當訪問者再次訪問同一頁面時,瀏覽器就可以直接從本地磁碟載入文檔。
瀏覽器緩存的優點有:
- 減少了冗餘的數據傳輸,節省了網費
- 減少了伺服器的負擔,大大提升了網站的性能
- 加快了客戶端載入網頁的速度
在前端開發麵試中,瀏覽器緩存是web性能優化面試題中很重要的一個知識點,從而說明瀏覽器緩存是提升web性能的一大利器,但是瀏覽器緩存如果使用不當,也會產生很多問題,正所謂是,想說愛你,並不是很容易的事。所以,結合最近遇到的案例,本文對瀏覽器緩存相關的知識進行總結歸納,希望對讀者有所幫助。
瀏覽器緩存的分類
瀏覽器緩存主要有兩類:緩存協商
和徹底緩存
,也有稱之為協商緩存
和強緩存
。
瀏覽器在第一次請求發生後,再次請求時:
- 瀏覽器會先獲取該資源緩存的header信息,根據其中的
expires
和cahe-control
判斷是否命中強緩存
,若命中則直接從緩存中獲取資源,包括緩存的header信息,本次請求不會與伺服器進行通信; - 如果沒有命中強緩存,瀏覽器會發送請求到伺服器,該請求會攜帶第一次請求返回的有關緩存的header欄位信息(Last-Modified/IF-Modified-Since、Etag/IF-None-Match),由伺服器根據請求中的相關header信息來對比結果是否命中協商緩存,若命中,則伺服器返回新的響應header信息更新緩存中的對應header信息,但是並不返回資源內容,它會告知瀏覽器可以直接從緩存獲取;否則返回最新的資源內容
強緩存
強緩存是利用http的返回頭中的Expires
或者Cache-Control
兩個欄位來控制的,用來表示資源的緩存時間。
Expires
該欄位是http1.0時的規範,它的值為一個絕對時間的GMT格式的時間字元串,比如Expires:Mon,18 Oct 2066 23:59:59
GMT。這個時間代表著這個資源的失效時間,在此時間之前,即命中緩存。這種方式有一個明顯的缺點,由於失效時間是一個絕對時間,所以當伺服器與客戶端時間偏差較大時,就會導致緩存混亂。
Cache-Control
Cache-Control是http1.1時出現的header信息,主要是利用該欄位的max-age
值來進行判斷,它是一個相對時間,例如Cache-Control:max-age=3600,代表著資源的有效期是3600秒。cache-control除了該欄位外,還有下麵幾個比較常用的設置值:
- no-cache:不使用本地緩存。需要使用緩存協商,先與伺服器確認返回的響應是否被更改,如果之前的響應中存在ETag,那麼請求的時候會與服務端驗證,如果資源未被更改,則可以避免重新下載。
- no-store:直接禁止游覽器緩存數據,每次用戶請求該資源,都會向伺服器發送一個請求,每次都會下載完整的資源。
- public:可以被所有的用戶緩存,包括終端用戶和CDN等中間代理伺服器。
- private:只能被終端用戶的瀏覽器緩存,不允許CDN等中繼緩存伺服器對其緩存。
Cache-Control與Expires可以在服務端配置同時啟用,同時啟用的時候Cache-Control優先順序高。
協商緩存
協商緩存就是由伺服器來確定緩存資源是否可用,所以客戶端與伺服器端要通過某種標識來進行通信,從而讓伺服器判斷請求資源是否可以緩存訪問,這主要涉及到下麵兩組header欄位,這兩組搭檔都是成對
出現的,即第一次請求的響應頭帶上某個欄位(Last-Modified
或者Etag
),則後續請求則會帶上對應的請求欄位(If-Modified-Since
或者If-None-Match
),若響應頭沒有Last-Modified或者Etag欄位,則請求頭也不會有對應的欄位。
Last-Modify/If-Modify-Since
瀏覽器第一次請求一個資源的時候,伺服器返回的header中會加上Last-Modify,Last-modify是一個時間標識該資源的最後修改時間,例如Last-Modify: Thu,31 Dec 2037 23:59:59 GMT。
當瀏覽器再次請求該資源時,request的請求頭中會包含If-Modify-Since,該值為緩存之前返回的Last-Modify。伺服器收到If-Modify-Since後,根據資源的最後修改時間判斷是否命中緩存。
如果命中緩存,則返回304,並且不會返回資源內容,並且不會返回Last-Modify。
ETag/If-None-Match
與Last-Modify/If-Modify-Since不同的是,Etag/If-None-Match返回的是一個校驗碼。ETag可以保證每一個資源是唯一的,資源變化都會導致ETag變化。伺服器根據瀏覽器上送的If-None-Match值來判斷是否命中緩存。
與Last-Modified不一樣的是,當伺服器返回304 Not Modified的響應時,由於ETag重新生成過,response header中還會把這個ETag返回,即使這個ETag跟之前的沒有變化。
為什麼要有Etag
你可能會覺得使用Last-Modified已經足以讓瀏覽器知道本地的緩存副本是否足夠新,為什麼還需要Etag呢?HTTP1.1中Etag的出現主要是為瞭解決幾個Last-Modified比較難解決的問題:
- 一些文件也許會周期性的更改,但是他的內容並不改變(僅僅改變的修改時間),這個時候我們並不希望客戶端認為這個文件被修改了,而重新GET;
- 某些文件修改非常頻繁,比如在秒以下的時間內進行修改,(比方說1s內修改了N次),If-Modified-Since能檢查到的粒度是s級的,這種修改無法判斷(或者說UNIX記錄MTIME只能精確到秒);
- 某些伺服器不能精確的得到文件的最後修改時間。
Last-Modified與ETag是可以一起使用的,伺服器會優先驗證ETag,一致的情況下,才會繼續比對Last-Modified,最後才決定是否返回304。
強緩存與協商緩存的區別可以用下表來表示:
|獲取資源形式|狀態碼|發送請求到伺服器
------|------------|------|----------------
強緩存|從緩存取 |200(from cache)|否,直接從緩存取
協商緩存|從緩存取|304(Not Modified)|否,通過伺服器來告知緩存是否可用
用戶行為對緩存的影響
用戶操作 | Expires/Cache-Control | Last-Modied/Etag |
---|---|---|
地址欄回車 | 有效 | 有效 |
頁面鏈接跳轉 | 有效 | 有效 |
新開視窗 | 有效 | 有效 |
前進回退 | 有效 | 有效 |
F5刷新 | 無效 | 有效 |
Ctrl+F5強制刷新 | 無效 | 無效 |
實際問題分析
如文章開頭所屬,代碼更新到線上後用戶瀏覽器不能自行更新,我們不能要求客戶在系統更新後都進行一次緩存清理的操作。
到底該如何解決呢?
在資源請求的URL中增加一個參數,比如:js/mian.js?ver=0.7.1。這個參數是一個版本號,每一次部署的時候變更一下,當這個參數變化的時候,強緩存都會失效並重新載入。這樣一來,靜態資源,部署以後就需要重新載入。這樣就比較完美的解決了問題。
進一步思考
這樣做是不是最完美的呢?很遺憾,不是。
百度張雲龍給出了這樣做的弊端,有興趣可參照下文:
靜態資源版本更新與緩存
謝謝!