Http超文本傳輸協議簡介

        當你在瀏覽器地址欄敲入“https://www.csdn.net/”,然後猛按回車,呈現在你面前的,將是博客園的首頁了(這真是廢話,你會認爲這是理所當然的)。作爲一個開發者,尤其是web開發人員,我想你有必要去了解這一系列的處理流程,在這期間,瀏覽器和服務器到底是如何打交道的?服務器又是如何處理的?瀏覽器又是如何將網頁顯示給用戶的呢?......

        疑惑和細節真是太多了。坦白講,要想徹徹底底的弄清楚以上每個疑惑和處理細節,至少需要十本書的厚度,所謂“底層無極限”嘛,而且不同的web服務 器和服務器端編程語言的實現和處理流程不盡相同(但本質都是相通的)。本文中,我將根據http協議的有關知識,跟大家講解一些web開發的本質。不管你 是從事.NET,還是J2EE或者php開發等等,都離不開這些本質。希望你讀完本文,能有新的收穫和見解。由於本人水平和經驗有限,難免有誤,望讀者見諒。

何爲http協議(Hypertext Transfer Protocol,超文本傳輸協議)?

所謂協議,就是指雙方遵循的規範。http協議,就是瀏覽器和服務器之間進行“溝通”的一種規範。我們在看空間,刷微博...都是在使用http協議,當然,遠遠不止這些應用。

既然TCP/UDP是廣泛使用的網絡通信協議,那爲啥有多出個http協議來呢?

筆者曾自己動手寫過一個簡單的web服務器處理軟件,根據我的推斷(不一定準確)。UDP協議具有不可靠性和不安全性,顯然這很難滿足web應用的需要。

而TCP協議是基於連接和三次握手的,雖然具有可靠性,但仍具有一定的缺陷。但試想一下,普通的C/S架構軟件,頂多上千個Client同時連接,而B/S架構的網站,十萬人同時在線也是很平常的事兒。如果十萬個客戶端和服務器一直保持連接狀態,那服務器如何滿足承載呢?

這就衍生出了http協議。基於TCP的可靠性連接。通俗點說,就是在請求之後,服務器端立即關閉連接、釋放資源。這樣既保證了資源可用,也吸取了TCP的可靠性的優點。

正因爲這點,所以大家通常說http協議是“無狀態”的,也就是“服務器不知道你客戶端幹了啥”,其實很大程度上是基於性能考慮的。以至於後來有了session之類的玩意。

學習http協議,主要需要了解http的請求和響應(當然,還有get、post等請求方式,狀態碼、URI、MIME等)


首先看看http請求消息(就是瀏覽器丟給服務器的):


一個http請求代表客戶端瀏覽器向服務器發送的數據。一個完整的http請求消息,包含一個請求行,若干個消息頭(請求頭),換行,實體內容

請求行:描述客戶端的請求方式、請求資源的名稱、http協議的版本號。 例如: GET/BOOK/JAVA.HTML HTTP/1.1

請求頭(消息頭)包含(客戶機請求的服務器主機名,客戶機的環境信息等):
Accept:用於告訴服務器,客戶機支持的數據類型  (例如:Accept:text/html,image/*)
Accept-Charset:用於告訴服務器,客戶機採用的編碼格式
Accept-Encoding:用於告訴服務器,客戶機支持的數據壓縮格式
Accept-Language:客戶機語言環境
Host:客戶機通過這個服務器,想訪問的主機名
If-Modified-Since:客戶機通過這個頭告訴服務器,資源的緩存時間
Referer:客戶機通過這個頭告訴服務器,它(客戶端)是從哪個資源來訪問服務器的(防盜鏈)
User-Agent:客戶機通過這個頭告訴服務器,客戶機的軟件環境(操作系統,瀏覽器版本等)
Cookie:客戶機通過這個頭,將Coockie信息帶給服務器
Connection:告訴服務器,請求完成後,是否保持連接
Date:告訴服務器,當前請求的時間

(換行)
實體內容:
就是指瀏覽器端通過http協議發送給服務器的實體數據。例如:name=dylan&id=110
(get請求時,通過url傳給服務器的值。post請求時,通過表單發送給服務器的值)
  
再看看HTTP響應消息(服務器返回給瀏覽器的):

一個http響應代表服務器端向客戶端回送的數據,它包括:
一個狀態行,若干個消息頭,以及實體內容

響應頭(消息頭)包含:
Location:這個頭配合302狀態嗎,用於告訴客戶端找誰
Server:服務器通過這個頭,告訴瀏覽器服務器的類型
Content-Encoding:告訴瀏覽器,服務器的數據壓縮格式
Content-Length:告訴瀏覽器,回送數據的長度
Content-Type:告訴瀏覽器,回送數據的類型
Last-Modified:告訴瀏覽器當前資源緩存時間
Refresh:告訴瀏覽器,隔多長時間刷新
Content-Disposition:告訴瀏覽器以下載的方式打開數據。例如: context.Response.AddHeader("Content-Disposition","attachment:filename=aa.jpg");                                        context.Response.WriteFile("aa.jpg");
Transfer-Encoding:告訴瀏覽器,傳送數據的編碼格式
ETag:緩存相關的頭(可以做到實時更新)
Expries:告訴瀏覽器回送的資源緩存多長時間。如果是-1或者0,表示不緩存
Cache-Control:控制瀏覽器不要緩存數據   no-cache
Pragma:控制瀏覽器不要緩存數據          no-cache

Connection:響應完成後,是否斷開連接。  close/Keep-Alive
Date:告訴瀏覽器,服務器響應時間

狀態行:  例如:  HTTP/1.1  200 OK   (協議的版本號是1.1  響應狀態碼爲200  響應結果爲 OK)

實體內容(實體頭):響應包含瀏覽器能夠解析的靜態內容,例如:html,純文本,圖片等等信息

例如:Content-Type: text/html;charset=UTF-8

理解了以上的http請求消息和響應消息,相信你對於http協議已經理解得足夠深刻了。關於http協議的更多具體細節,可以參照http RFC文檔

大致步驟就是:瀏覽器先向服務器發送請求,服務器接收到請求後,做相應的處理,然後封裝好響應報文,再回送給瀏覽器。

 

其他參考:https://www.cnblogs.com/qdhxhz/p/8468913.html

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章