百度的head和get

原創

2020-02-25 22:55

百度的 head 和 get

2008-07-19 06:15:45 HEAD http://www. 域名 .com/55601.htm - 61.135.168.146 HTTP/1.1 Baiduspider+ +http://www.baidu.com/search/spider.htm - 200 163

2008-07-19 06:15:48 HEAD http://www. 域名 .com/play/69865.htm - 61.135.168.146 HTTP/1.1 Baiduspider+ +http://www.baidu.com/search/spider.htm - 200 163

2008-07-19 06:15:49 HEAD http://www. 域名 .com/play/83017.htm - 61.135.168.146 HTTP/1.1 Baiduspider+ +http://www.baidu.com/search/spider.htm - 200 163

2008-07-19 06:15:51 HEAD http://www. 域名 .com/mlist/3318.htm - 61.135.168.146 HTTP/1.1 Baiduspider+ +http://www.baidu.com/search/spider.htm - 200 163

2008-07-19 06:15:54 HEAD http://www. 域名 .com/play/68504.htm - 61.135.168.146 HTTP/1.1 Baiduspider+ +http://www.baidu.com/search/spider.htm - 200 163

2008-07-19 06:1

那是不是每次訪問都要下載頁面的全部內容呢？答案是否定的百度使用了 "GET", 百度的 spider 順序會定週期的訪問網站的頁面。 "POST" 之外的 HTTP 方法： HEAD

而沒有正文。 baidu 通過這種 HEAD 請求，可以利用極少量的帶寬來獲得某網頁的頭部信息。通過頭信息中的 HTTP 狀態碼 ( 200 等 ) 百度可以瞭解這個網頁的大體狀態，比方是否存在否轉向，否可用等；通過 Content-Length, HEAD 一般情況下會在服務器上產生與 GET 相同的處置（除非代碼中對 HEAD 情況做了處置）只不過返回給客戶端的 header 信息。 Last-Modifi 中的任一項與之前的訪問記錄做對比，百度可以進一步判斷這個網頁是否需要更新。

但實際上只要有 content-length 或 Last-Modifi 任一項，就可以迎合 baidu 蜘蛛了就稱得上很好的支持百度的 HEAD 否有 content-length 和 last-Modifi , 很多人以爲動態網頁對 HEAD 支持不好。和服務器軟件、配置、腳本語言、否緩衝，順序編寫有關的比方 apache+php 默認是有 content-length 一項的 apache+python 默認是沒有這兩項的通過順序控制可以人爲的添加 Last-Modifi 頭信息。

即使有的網站不能很好的支持 HEAD, 但在實踐中。百度還是不停的發生 HEAD 請求。所以針對這種情況，可以有兩方面的措施： 1. 網頁禁止 head 請求，以免發生無謂的資源消耗； 2. 通過配置或者順序修改，支持 content-length 或 last-modifi 輸出。

大家知道該如何優化了吧？知道了這些。>

注：

卻可能帶來服務器的兩次請求（如果需要更新，百度的此種方法便宜了 baidu 帶寬。百度還會來第二次）個損人利己的措施；那麼 googl 如何減少帶寬損耗的呢？

沒有使用 HEAD 不會讓服務器重複幹活。但他也在減少帶寬方面做了努力：通過支持 gzip/defleat 壓縮的方式減少帶寬。這樣請求與普通瀏覽器訪問無異， goog 大氣一些。幾乎不會帶來多餘的負擔。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

百度的head和get

我的 PHP安裝筆記

女站長艱難做網站的開始

解決百度快照不更新的辦法

關於SQL ASP批量替換語句執行

百度的head和get

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結