HTTP 返回狀態代碼詳解

  1. 1xx(臨時響應)表示臨時響應並需要請求者繼續執行操作的狀態代碼。

    100(繼續)請求者應當繼續提出請求。 服務器返回此代碼表示已收到請求的第一部分,正在等待其餘部分;101(切換協議)請求者已要求服務器切換協議,服務器已確認並準備切換。

  2. 2

    2xx(成功)

    表示服務器成功處理了請求的狀態代碼。

    200(成功)服務器已成功處理了請求。通常,這表示服務器提供了請求的網頁。 如果針對您的 robots.txt 文件顯示此狀態,則表示 Googlebot 已成功檢索到該文件;201(已創建)請求成功並且服務器創建了新的資源;202(已接受)服務器已接受請求,但尚未處理;203(非授權信息)服務器已成功處理了請求,但返回的信息可能來自另一來源;204(無內容)服務器成功處理了請求,但沒有返回任何內容;205(重置內容)服務器成功處理了請求,但沒有返回任何內容;206(部分內容)服務器成功處理了部分 GET 請求。

  3. 3

    3xx(重定向)要完成請求,需要進一步操作。 通常,這些狀態代碼用來重定向。 Google 建議您在每次請求中使用重定向不要超過 5 次。 您可以使用網站管理員工具查看一下 Googlebot 在抓取重定向網頁時是否遇到問題。 診斷下的網 絡抓取頁面列出了由於重定向錯誤而導致 Googlebot 無法抓取的網址。

    300(多種選擇)針對請求,服務器可執行多種操作。 服務器可根據請求者(用戶代理)選擇一項操作,或提供操作列表供請求者選擇;301(永久移動)請求的網頁已永久移動到新位置。 服務器返回此響應(對 GET 或 HEAD 請求的響應)時,會自動將請求者轉到新位置。 您應使用此代碼告訴 Googlebot 某個網頁或網站已永久移動到新位置;302(暫時移動)服 務器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以後的請求。 此代碼與響應 GET 或 HEAD 請求的 301 代碼類似,會自動將請求者轉到不同的位置,但您不應使用此代碼來告訴 Googlebot 某個網頁或網站已經移動,因爲 Googlebot 會繼續抓取原有位置並編入索引;303(查看其他位置)請求者應當對不同的位置使用單獨的 GET 請求來檢索響應時,服務器返回此代碼。 對於除 HEAD 之外的所有請求,服務器會自動轉到其他位置;304(未修改)自從上次請求後,請求的網頁未修改過。服務器返回此響應時,不會返回網頁內容。如果網頁自請求者上次請求後再也沒有更改 過,您應當將服務器配置爲返回此響應(稱爲 If-Modified-Since HTTP 標頭)。 由於服務器可以告訴 Googlebot 自從上次抓取後網頁沒有更改過,因此可節省帶寬和開銷;305(使用代理)請求者只能使用代理訪問請求的網頁。 如果服務器返回此響應,還表示請求者應使用代理;307(暫時重定向)服 務器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以後的請求。 此代碼與響應 GET 和 HEAD 請求的 301 代碼類似,會自動將請求者轉到不同的位置,但您不應使用此代碼來告訴 Googlebot 某個頁面或網站已經移動,因爲 Googlebot 會繼續抓取原有位置並編入索引。

  4. 4

    4xx(請求錯誤)這些狀態代碼表示請求可能出錯,妨礙了服務器的處理。

    400(錯誤請求)服務器不理解請求的語法;401(未授權)請求要求身份驗證。 對於需要登錄的網頁,服務器可能返回此響應;403(禁止)服務器拒絕請求。 如果您看到 Googlebot 在嘗試抓取您網站上的有效網頁時收到此狀態代碼(可以在 Google 網站管理員工具診 斷下的網絡抓取頁面上看到此信息),可能是您的服務器或主機拒絕 Googlebot 訪問;404(未找到)服務器找不到請求的網頁。 例如,如果請求服務器上不存在的網頁,服務器通常會返回此代碼。如果您的網站上沒有 robots.txt 文件,而您在 Google 網站管理員工具”診斷”標籤的 robots.txt 頁上看到此狀態,那麼這是正確的狀態。 但是,如果您有 robots.txt 文件而又看到此狀態,則說明您的 robots.txt 文件可能命名錯誤或位於錯誤的位置 (該文件應當位於頂級域名,名爲 robots.txt)。如果您看到有關 Googlebot 嘗試抓取的網址的此狀態(在”診斷”標籤的 HTTP 錯誤頁上),則表示 Googlebot 追蹤的可能是另一個頁面的無效鏈接(是舊鏈接或輸入有誤的鏈接);405(禁用的方法)禁用請求中指定的方法;406(不可接受)無法使用請求的內容特性響應請求的網頁;407(需要代理授權)此狀態代碼與 401(未授權)類似,但指定請求者應當授權使用代理。 如果服務器返回此響應,還會指明請求者應當使用的代理;408(請求超時)服務器等候請求時發生超時;409(衝突)服務器在完成請求時發生衝突。 服務器必須在響應中包含有關衝突的信息。 服務器在響應與前一個請求相沖突的 PUT 請求時可能會返回此代碼,同時會附上兩個請求的差異列表;410(已刪除)如果請求的資源已永久刪除,服務器就會返回此響應。 該代碼與 404(未找到)代碼相似,但在資源以前存在而現在不存在的情況下,有時會用來替代 404 代碼。 如果資源已永久刪除,您應當使用 301 指定資源的新位置;411(需要有效長度)服務器不接受不含有效內容長度標頭字段的請求;412(未滿足前提條件)服務器未滿足請求者在請求中設置的其中一個前提條件;413(請求實體過大)服務器無法處理請求,因爲請求實體過大,超出服務器的處理能力;414(請求的 URI 過長)請求的 URI(通常爲網址)過長,服務器無法處理;415(不支持的媒體類型)請求的格式不受請求頁面的支持;416(請求範圍不符合要求)如果頁面無法提供請求的範圍,則服務器會返回此狀態代碼;417(未滿足期望要求)服務器未滿足”期望”請求標頭字段的要求。

  5. 5

    5xx(服務器錯誤)這些狀態代碼表示服務器在嘗試處理請求時發生內部錯誤。 這些錯誤可能是服務器本身的錯誤,而不是請求出錯。

    500(服務器內部錯誤)服務器遇到錯誤,無法完成請求;501(尚未實施)服務器不具備完成請求的功能。 例如,服務器無法識別請求方法時可能會返回此代碼;502(錯誤網關)服務器充當網關或代理,從上游服務器收到無效響應;503(服務不可用)服務器目前無法使用(由於超載或停機維護)。 通常,這只是暫時狀態;504(網關超時)服務器充當網關或代理,但沒有及時從上游服務器收到請求;505(HTTP 版本不受支持)服務器不支持請求中所用的 HTTP 協議版本。

    END

注意事項

  • 200號狀態碼:220.181.32.30 - - [02/Sep/2008:00:01:23 +0800] "GET /article/0572/72570.shtml HTTP/1.1" 200 28361 "-" "Baiduspider+(http://www.gzlij.com)" 服務器日誌中的200表示使用GET傳遞方式網頁72570.shtml下載成功。即:當用戶或爬蟲程序向網站服務器發出瀏覽請求時,服務器返回 HTTP 數據流裏包含某種狀態碼,200響應號即狀態碼中的一種,表示本網頁被成功下載。
  • 301號狀態碼:220.181.32.30 - - [02/Sep/2008:00:01:31 +0800] "GET /my/view.php?aid=14183 HTTP/1.1" 301 - "-" "Baiduspider+(http://www.heyzc.com)" 服務器日誌中的301表示使用GET傳遞方式動態網頁aid=14183成功跳轉。即:當用戶或爬蟲程序向網站服務器發出瀏覽請求時,服務器返回 HTTP 數據流包含某種狀態碼,301 重定向即狀態碼中的一種,表示本網頁永久性轉移到另一個地址。實際操作中我們可以將多個域名指向同一個網址,這也是搜索引擎唯一認可的一種網站轉向的方式。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章