apache PHP如何利用HTTP緩存協議原理解析及應用指南

http協議裏控制瀏覽器緩存的頭有三個Cache-Control,Expires,Last-Modified
對於靜態頁面還有Etag。
一、先來看第一種情況:apache 靜態頁面
apache發送給客戶端的靜態頁面一般包含Last-Modified和Etag,這兩個標籤的值來自靜態文件的修改時間和inode,
下面是截取得apache返回客戶端的頭
---------
Last-Modified: Fri, 26 Jan 2007 01:53:34 GMT
ETag: "3f9f640-318-cb9f8380"
---------
搜索引擎之所以喜歡靜態文件是因爲有這兩個標識,可以判斷文件是否更新過

二、PHP等動態頁面
由於php是動態生成的,它的內容是不能根據php程序的時間來確定最後修改日期,所以默認php返回客戶端的時候補包含任何緩存控制,要想利用好緩存就必須瞭解緩存機制,和理減少b,s的交互,縮減帶寬流量,減輕服務器負擔...好處多多

三、緩存控制的具體含義
先解釋一下本人經過測試理解的這幾個標籤的含義
Cache-Control:指定請求和響應遵循的緩存機制。在請求消息或響應消息中設置Cache-Control並不會修改另一個消息處理過程中的緩存處理過程。請求時的緩存指令包括no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached,響應消息中的指令包括public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age。各個消息中的指令含義如下:
Public指示響應可被任何緩存區緩存。
Private指示對於單個用戶的整個或部分響應消息,不能被共享緩存處理。這允許服務器僅僅描述當用戶的部分響應消息,此響應消息對於其他用戶的請求無效。
no-cache指示請求或響應消息不能緩存
no-store用於防止重要的信息被無意的發佈。在請求消息中發送將使得請求和響應消息都不使用緩存。
max-age指示客戶機可以接收生存期不大於指定時間(以秒爲單位)的響應。
min-fresh指示客戶機可以接收響應時間小於當前時間加上指定時間的響應。
max-stale指示客戶機可以接收超出超時期間的響應消息。如果指定max-stale消息的值,那麼客戶機可以接收超出超時期指定值之內的響應消息。
php用法:
在輸出之前用header(),(如果使用ob_start()可以將header放在程序任意地方)
header('Cache-Control: max-age=8');
max-age=8表示最大生存期8秒,超過8秒瀏覽器必須去服務器重新讀取,這個時間是以用戶的讀取頁面開始計時的,而Expires是絕對時間。
Expires:緩存過期的絕對時間,如果過了它指定的那個時間點,瀏覽器就不認緩存了,要去服務器重新請求一份最新的。

Last-Modified:文檔的最後修改時間,它的妙用就是:1 如果是靜態文件,客戶端會發上來它緩存裏的時間,apache會來比對,如果發現沒有修改就直接返回一個頭,狀態碼是304,字節數非常少,(高級版本還會增加比較Etag來確定文件是否變化)
2 php動態文件: 客戶端發上比對時間,php會判斷是否修改,如果修改時間相同,就只會返回1024字節,至於爲什麼返回1024不得而知,如果你的php生成的文件非常大,它也只返回1024,所以比較省帶寬,客戶端會根據服務器端發過來的修改時間自動從緩存文件裏顯示。

注:如果沒有Last-Modified頭,Cache-Control和Expires也是可以起作用的,但每次請求要返回真實的文件字節數,而不是1024

四、HOW ?
靜態頁面不用去管它了,如果想更好的控制靜態頁面的緩存,apache有幾個模塊可以很好的控制,這裏不討論
php頁面:
這裏分兩種:1 不經常改動的頁面,類似新聞發佈,這類頁面的特點:第一次發佈之後會有幾次改動,隨着時間推移基本不會再修改。控制策略應該是:1第一次發佈之發送Last-Modified,max-age設定1天,修改過之後更新Last-Modified,max-age時間隨着修改次數正常。這樣似乎比較繁瑣,還要記錄修改次數,也可以預計一下下次可能的修改時間用Expires指定到大概時間過期
php代碼:
//header('Cache-Control: max-age=86400');//緩存一天
header('Expires: Mon, 29 Jan 2007 08:56:01 GMT');//指定過期時間
header('Last-Modified: '.gmdate('D, d M Y 01:01:01',$time).' GMT');//格林尼治時間,$time是文件添加時候的時間戳
2 經常改動的頁面 類似bbs,論壇程序,這種頁面更新速度比較快,緩存的主要作用是防止用戶頻繁刷新列表,導致服務器數據庫負擔,既要保證更新的及時性,也要保證緩存能被利用
這裏一般用Cache-Control來控制,根據論壇的發帖的頻率靈活控制max-age。
header('Cache-Control: max-age=60');//緩存一分鐘
header('Last-Modified: '.gmdate('D, d M Y 01:01:01',$time).' GMT');//格林尼治時間,$time是帖子的最後更新時間戳

五 額外
1 刷新,轉到,強制刷新的區別
瀏覽器上有刷新和轉到按鍵,有的瀏覽器支持用ctrl+F5強制刷新頁面,它們的區別是什麼?
轉到:用戶點擊鏈接就是轉到,它完全使用緩存機制,如果有Last-Modified那麼不會和服務器通訊,用抓包工具可以查看到發送字節是0byte,如果緩存過期,那麼它會執行F5刷新的動作。
刷新(F5):這種刷新也是根據緩存是否有Last-Modified來決定,如果有會轉入304或1024(php),如果沒有最後更新時間那麼去服務器讀取,返回真實文檔大小
強制刷新:完全拋棄緩存機制,去服務器讀取最新文檔,向服務器發送的header如下
Cache-Control: no-cache

2 調試工具
查看瀏覽器和服務器交互比較好的工具是httpwatch pro,現在的版本4.1,支持ie7
還有別的代理抓包工具可以分析,http debugging。沒用過,還有tcp抓包工具,2000自帶的network monitor不過不是專門針對http的比較難用
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章