【HTTP】徹底弄懂HTTP緩存機制及原理

前言

Http 緩存機制作爲 web 性能優化的重要手段,對於從事 Web 開發的同學們來說,應該是知識體系庫中的一個基礎環節,同時對於有志成爲前端架構師的同學來說是必備的知識技能。
但是對於很多前端同學來說,僅僅只是知道瀏覽器會對請求的靜態文件進行緩存,但是爲什麼被緩存,緩存是怎樣生效的,卻並不是很清楚。
在此,我會嘗試用簡單明瞭的文字,像大家系統的介紹HTTP緩存機制,期望對各位正確的理解前端緩存有所幫助。

在介紹HTTP緩存之前,作爲知識鋪墊,先簡單介紹一下HTTP報文

HTTP報文就是瀏覽器和服務器間通信時發送及響應的數據塊。
瀏覽器向服務器請求數據,發送請求(request)報文;服務器向瀏覽器返回數據,返回響應(response)報文。
報文信息主要分爲兩部分
1.包含屬性的首部(header)————————–附加信息(cookie,緩存信息等)與緩存相關的規則信息,均包含在header中
2.包含數據的主體部分(body)———————–HTTP請求真正想要傳輸的部分

緩存規則解析

爲方便大家理解,我們認爲瀏覽器存在一個緩存數據庫,用於存儲緩存信息。
在客戶端第一次請求數據時,此時緩存數據庫中沒有對應的緩存數據,需要請求服務器,服務器返回後,將數據存儲至緩存數據庫中。

這裏寫圖片描述

HTTP緩存有多種規則,根據是否需要重新向服務器發起請求來分類,我將其分爲兩大類(強制緩存,對比緩存)
在詳細介紹這兩種規則之前,先通過時序圖的方式,讓大家對這兩種規則有個簡單瞭解。

已存在緩存數據時,僅基於強制緩存,請求數據的流程如下

這裏寫圖片描述

已存在緩存數據時,僅基於對比緩存,請求數據的流程如下

這裏寫圖片描述

對緩存機制不太瞭解的同學可能會問,基於對比緩存的流程下,不管是否使用緩存,都需要向服務器發送請求,那麼還用緩存幹什麼?
這個問題,我們暫且放下,後文在詳細介紹每種緩存規則的時候,會帶給大家答案。

我們可以看到兩類緩存規則的不同,強制緩存如果生效,不需要再和服務器發生交互,而對比緩存不管是否生效,都需要與服務端發生交互。
兩類緩存規則可以同時存在,強制緩存優先級高於對比緩存,也就是說,當執行強制緩存的規則時,如果緩存生效,直接使用緩存,不再執行對比緩存規則。

強制緩存

從上文我們得知,強制緩存,在緩存數據未失效的情況下,可以直接使用緩存數據,那麼瀏覽器是如何判斷緩存數據是否失效呢?
我們知道,在沒有緩存數據的時候,瀏覽器向服務器請求數據時,服務器會將數據和緩存規則一併返回,緩存規則信息包含在響應header中

對於強制緩存來說,響應header中會有兩個字段來標明失效規則(Expires/Cache-Control
使用chrome的開發者工具,可以很明顯的看到對於強制緩存生效時,網絡請求的情況

這裏寫圖片描述

Expires

Expires的值爲服務端返回的到期時間,即下一次請求時,請求時間小於服務端返回的到期時間,直接使用緩存數據。
不過Expires 是HTTP 1.0的東西,現在默認瀏覽器均默認使用HTTP 1.1,所以它的作用基本忽略。
另一個問題是,到期時間是由服務端生成的,但是客戶端時間可能跟服務端時間有誤差,這就會導致緩存命中的誤差。
所以HTTP 1.1 的版本,使用Cache-Control替代。

Cache-Control

Cache-Control 是最重要的規則。常見的取值有private、public、no-cache、max-age,no-store,默認爲private

  • private: 客戶端可以緩存
  • public: 客戶端和代理服務器都可緩存(前端的同學,可以認爲public和private是一樣的)
  • max-age=xxx: 緩存的內容將在 xxx 秒後失效
  • no-cache: 需要使用對比緩存來驗證緩存數據(後面介紹)
  • no-store: 所有內容都不會緩存,強制緩存,對比緩存都不會觸發(對於前端開發來說,緩存越多越好,so…基本上和它說886)

舉個例子

這裏寫圖片描述

圖中Cache-Control僅指定了max-age,所以默認爲private,緩存時間爲31536000秒(365天)
也就是說,在365天內再次請求這條數據,都會直接獲取緩存數據庫中的數據,直接使用。

對比緩存

對比緩存,顧名思義,需要進行比較判斷是否可以使用緩存。
瀏覽器第一次請求數據時,服務器會將緩存標識與數據一起返回給客戶端,客戶端將二者備份至緩存數據庫中。
再次請求數據時,客戶端將備份的緩存標識發送給服務器,服務器根據緩存標識進行判斷,判斷成功後,返回304狀態碼,通知客戶端比較成功,可以使用緩存數據。

第一次訪問:

這裏寫圖片描述

再次訪問:

這裏寫圖片描述

通過兩圖的對比,我們可以很清楚的發現,在對比緩存生效時,狀態碼爲304,並且報文大小和請求時間大大減少。
原因是,服務端在進行標識比較後,只返回header部分,通過狀態碼通知客戶端使用緩存,不再需要將報文主體部分返回給客戶端。

對於對比緩存來說,緩存標識的傳遞是我們着重需要理解的,它在請求header和響應header間進行傳遞,
一共分爲兩種標識傳遞,接下來,我們分開介紹。

Last-Modified / If-Modified-Since

Last-Modified:服務器在響應請求時,告訴瀏覽器資源的最後修改時間。

這裏寫圖片描述

If-Modified-Since:
再次請求服務器時,通過此字段通知服務器上次請求時,服務器返回的資源最後修改時間。
服務器收到請求後發現有頭If-Modified-Since 則與被請求資源的最後修改時間進行比對。
若資源的最後修改時間大於If-Modified-Since,說明資源又被改動過,則響應整片資源內容,返回狀態碼200;
若資源的最後修改時間小於或等於If-Modified-Since,說明資源無新修改,則響應HTTP 304,告知瀏覽器繼續使用所保存的cache。

這裏寫圖片描述

Etag / If-None-Match(優先級高於Last-Modified / If-Modified-Since)

Etag:
服務器響應請求時,告訴瀏覽器當前資源在服務器的唯一標識(生成規則由服務器決定)。
這裏寫圖片描述

If-None-Match:
再次請求服務器時,通過此字段通知服務器客戶段緩存數據的唯一標識。
服務器收到請求後發現有頭If-None-Match 則與被請求資源的唯一標識進行比對,
不同,說明資源又被改動過,則響應整片資源內容,返回狀態碼200;
相同,說明資源無新修改,則響應HTTP 304,告知瀏覽器繼續使用所保存的cache。

這裏寫圖片描述

總結

對於強制緩存,服務器通知瀏覽器一個緩存時間,在緩存時間內,下次請求,直接用緩存,不在時間內,執行比較緩存策略。
對於比較緩存,將緩存信息中的Etag和Last-Modified通過請求發送給服務器,由服務器校驗,返回304狀態碼時,瀏覽器直接使用緩存。

瀏覽器第一次請求
這裏寫圖片描述

瀏覽器再次請求時

這裏寫圖片描述

文中如果出現錯誤,希望小夥伴們可以諒解,更希望可以給予指正


HTTP緩存相關的概念 http請求頭信息 http響應頭信息

請求頭:瀏覽器向服務器發送請求的數據,資源。
響應頭:服務器向瀏覽器響應數據,告訴瀏覽器我是誰,我要你怎麼做。如,我是nginx,給你的資源是正確的200 還是錯誤的404,我要你緩存多久。

常見的請求頭:

Accept: text/html,image/*                                            瀏覽器可以接收的類型 
Accept-Charset: ISO-8859-1                                      瀏覽器可以接收的編碼類型
Accept-Encoding: gzip,compress                               瀏覽器可以接收壓縮編碼類型 
Accept-Language: en-us,zh-cn                                瀏覽器可以接收的語言和國家類型
Host: www.lks.cn:80                                               瀏覽器請求的主機和端口
If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT   某個頁面緩存時間 
Referer: http://www.lks.cn/index.html                         請求來自於哪個頁面
User-Agent: Mozilla/4.0 compatible; MSIE 5.5; Windows NT 5.0   瀏覽器相關信息
Cookie:                                                                    瀏覽器暫存服務器發送的信息
Connection: close1.0/Keep-Alive1.1                          HTTP請求的版本的特點
Date: Tue, 11 Jul 2000 18:23:51GMT                       請求網站的時間
Allow:GET                                                                  請求的方法 GET 常見的還有POST
Keep-Alive:5                                                            連接的時間;5
Connection:keep-alive                                             是否是長連接
Cache-Control:max-age=300                                   緩存的最長時間 300s
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

常見的響應頭:

Location: http://www.lks.cn/index.html                          控制瀏覽器顯示哪個頁面 
Server:apache nginx                                                   服務器的類型 
Content-Encoding: gzip                                               服務器發送的壓縮編碼方式 
Content-Length: 80                                                     服務器發送顯示的字節碼長度 
Content-Language: zh-cn                                           服務器發送內容的語言和國家名 
Content-Type: image/jpeg; charset=UTF-8                 服務器發送內容的類型和編碼類型 
Last-Modified: Tue, 11 Jul 2000 18:23:51GMT           服務器最後一次修改的時間 
Refresh: 1;url=http://www.lks.cn                                  控制瀏覽器1秒鐘後轉發URL所指向的頁面 
Content-Disposition: attachment; filename=lks.jpg      服務器控制瀏覽器發下載方式打開文件 
Transfer-Encoding: chunked                                      服務器分塊傳遞數據到客戶端  
Set-Cookie:SS=Q0=5Lb_nQ; path=/search                服務器發送Cookie相關的信息 
Expires: -1                                                                  資源的過期時間,提供給瀏覽器緩存數據,-1永遠過期 
Cache-Control: no-cache                                           告訴瀏覽器,一定要回服務器校驗,不管有沒有緩存數據。 
Pragma: no-cache                                                      服務器控制瀏覽器不要緩存網頁   
Connection: close/Keep-AliveHTTP                           請求的版本的特點   
Date: Tue, 11 Jul 2000 18:23:51 GMT                       響應網站的時間 
ETag:“ihfdgkdgnp98hdfg”                                       資源實體的標識(唯一標識,類似md5值,文件有修改md5就不一樣)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

關於緩存相關頭的解釋:

Expires

一個GMT時間,試圖告知瀏覽器,在此日期內,可以信任並使用對應緩存中的副本,缺點是,一但客戶端日期不準確.則可能導致失效.

Pragma : no-cache

這個是http1.0中的常規頭,作用同http1.1的 Cache-Control : no-cache

Last-Modified

一個GMT時間,告知被請求實體的最後修改時間.用於瀏覽器校驗其緩存副本是否仍然可以信任.與其相關的兩個條件請求標頭:

  1. If-Modified-Since
    僅在get方法中意義,這個也是比較常見的。 如果實體在指定時間後,沒有修改則返回一個304,否則返回一個常規的Get請求的響應(比如200),靜態文件沒有修改返回304是好的,因爲它只是回服務器校驗一下是否有修改,而並沒有像200那樣重新請求數據。

  2. If-Unmodified-Since:
    如果實體沒有任何修改,那麼就可以直接執行該請求, 而如果有修改,則返回一個412 Precondition Failed狀態碼,並且拋棄該方法對應的行爲操作(GET方法除外).

Cache-Control (http1.1的常見頭)

  1. public
    僅體現在響應頭,通知瀏覽器可以無條件的緩存該響應。

  2. private
    僅體現在響應頭,通知瀏覽器只針對單個用戶緩存響應. 且可以具體指定某個字段.如private –“username”

  3. no-cache
    a) 請求頭中:告訴瀏覽器回去服務器取數據,並驗證你的緩存(如果有的話)。
    b) 響應頭中:告訴瀏覽器,一定要回服務器校驗,不管有沒有緩存數據。 如果確定沒有被改,可以使用緩存中的數據

  4. no-store
    告訴瀏覽器任何情況下都不要被緩存。

  5. max-age
    a) 請求頭中:強制響應瀏覽器,根據該值,校驗緩存.即與自身的Age值,與請求時間做比較.如果超出max- age值,則強制去服務器端驗證.以確保返回一個新鮮的響應.其功能本質上與傳統的Expires類似,但區別在於Ex
    pires是根據某個特定日期值做比較.一但緩存者自身的時間不準確.則結果可能就是錯誤的.而max-age,顯然無 此問題.
    Max-age的優先級也是高於Expires的.
    b) 響應頭中:同上

        <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/markdown_views-ea0013b516.css">
            </div>
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章