常用通信協議介紹(HTTP,UDP,TCP,HTTPS)

       在介紹常用的通信協議HTTP,UDP,TCP,HTTPS等之前,我們先明確下什麼是通信協議!

    通信協議(communications protocol)是指雙方實體完成通信或服務所必須遵循的規則和約定。通過通信信道和設備互連起來的多個不同地理位置的數據通信系統,要使其能協同工作實現信息交換和資源共享,它們之間必須具有共同的語言。交流什麼、怎樣交流及何時交流,都必須遵循某種互相都能接受的規則。這個規則就是通信協議。

    通俗的講,就是幾方約定的一個口號,這個口號由一定的規則組成,只有明確這個規則,你才知道表達的意義,否則你只得到口號,沒有規則,就無法明確要表達的意義。

    下面首先講常用通信協議之間的關係。    

     TCP   HTTP   UDP三者的關係:

     TCP/IP是個協議組,可分爲四個層次:網絡接口層、網絡層、傳輸層和應用層。

     在網絡層有IP協議、ICMP協議、ARP協議、RARP協議和BOOTP協議。

     在傳輸層中有TCP協議與UDP協議。

     在應用層有FTP、HTTP、TELNET、SMTP、DNS等協議。

     因此,HTTP本身就是一個協議,是從Web服務器傳輸超文本到本地瀏覽器的傳送協議。    

    socket(只是一種連接模式,不是協議): 
     這是爲了實現以上的通信過程而建立成來的通信管道,其真實的代表是客戶端和服務器端的一個通信進程,雙方進程通過socket進行通信,而通信的規則採用指定的協議。socket只是一種連接模式,不是協議,tcp、udp,簡單的說(雖然不準確)是兩個最基本的協議,很多其它協議都是基於這兩個協議如,http就是基於tcp的,.用socket可以創建tcp連接,也可以創建udp連接,這意味着,用socket可以創建任何協議的連接,因爲其它協議都是基於此的。

    下面我們主要來看一下和我們互聯網生活密切相關的協議:HTTP

     什麼是Http協議

    HTTP全稱是HyperText Transfer Protocal,即:超文本傳輸協議,從1990年開始就在WWW上廣泛應用,是現今在WWW上應用最多的協議, Http是應用層協議,當你上網瀏覽網頁的時候,瀏覽器和Web服務器之間就會通過HTTP在Internet上進行數據的發送和接收。Http是一個基於請求/響應模式的、無狀態的協議。即我們通常所說的Request/Response。

    URL:
     URL(Uniform Resource Locator) 地址用於描述一個網絡上的資源,  基本格式如下
     scheme://host[:port#]/path/…/[?query-string][#anchor]
     scheme               指定低層使用的協議(例如:http, https, ftp)
     host                    HTTP服務器的IP地址或者域名
     port#                  HTTP服務器的默認端口是80,這種情況下端口號可以省略。如果使用了別的端口,必須指明,例如 http://www.cnblogs.com:8080/
     path                   訪問資源的路徑
     query-string       發送給http服務器的數據
     anchor-             錨
     URL 的一個例子
     http://www.mywebsite.com/sj/test/test.aspx?name=sviergn&x=true#stuff
    Scheme:                 http
    host:                   www.mywebsite.com
    path:                   /sj/test/test.aspx
    Query String:           name=sviergn&x=true
    Anchor:                 stuff

   HTTP的Request/Response:

   先看Request 消息的結構,   Request 消息分爲3部分

   第一部分叫Request line,

   第二部分叫Request header,

   第三部分是body. header和body之間有個空行,

   結構如下圖

   第一行中的Method表示請求方法,比如”POST”,”GET”,  Path-to-resoure表示請求的資源, Http/version-number 表示HTTP協議的版本號

   當使用的是”GET” 方法的時候, body是爲空的

   比如我們打開博客園首頁的request 如下

   GET http://www.cnblogs.com/ HTTP/1.1
   Host: www.cnblogs.com

   抽象的東西,難以理解,老感覺是虛的, 所謂眼見爲實, 實際見到的東西,我們才能理解和記憶。 我們今天用Fiddler,實際的看看Request和Response.

   下面我們打開Fiddler 捕捉一個博客園登錄的Request 然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Request的消息,

   如下圖:

   

  Accept

  作用: 瀏覽器端可以接受的媒體類型,

  例如:  Accept: text/html  代表瀏覽器可以接受服務器回發的類型爲 text/html  也就是我們常說的html文檔,

  如果服務器無法返回text/html類型的數據,服務器應該返回一個406錯誤(non acceptable)

  通配符 * 代表任意類型

  例如  Accept: */*  代表瀏覽器可以處理所有類型,(一般瀏覽器發給服務器都是發這個)

  Referer:

  作用: 提供了Request的上下文信息的服務器,告訴服務器我是從哪個鏈接過來的,比如從我主頁上鍊接到一個朋友那裏,他的服務器就能夠從HTTP Referer中統計出每天有多少用戶點擊我主頁上的鏈接訪問他的網站。

  例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

 Accept-Language

  作用: 瀏覽器申明自己接收的語言。

  語言跟字符集的區別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等;

  例如: Accept-Language: en-us

  Content-Type

  作用:

  例如:Content-Type: application/x-www-form-urlencoded

  Accept-Encoding:

  作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支持壓縮,支持什麼壓縮方法(gzip,deflate),(注意:這不是字符編碼);

  例如: Accept-Encoding: gzip, deflate

  User-Agent

  作用:告訴HTTP服務器, 客戶端使用的操作系統和瀏覽器的名稱和版本.

   我們上網登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,服務器應用程序就是從User-Agent這個請求報頭域中獲取到這些信息User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。

   例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

    Connection

   例如: Connection: keep-alive   當一個網頁打開完成後,客戶端和服務器之間用於傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接

   例如:  Connection: close  代表一個Request完成後,客戶端和服務器之間用於傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

   Content-Length

   作用:發送給HTTP服務器數據的長度。

   例如: Content-Length: 38

   Host(發送請求時,該報頭域是必需的)

   作用: 請求報頭域主要用於指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的

   例如: 我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html

   瀏覽器發送的請求消息中,就會包含Host請求報頭域,如下:

   Host:http://www.guet.edu.cn

   此處使用缺省端口號80,若指定了端口號,則變成:Host:指定端口號

   Pragma

    作用: 防止頁面被緩存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣

    Pargma只有一個用法, 例如: Pragma: no-cache

  Cookie:

    作用: 最重要的header, 將cookie的值發送給HTTP 服務器

  Accept-Charset

    作用:瀏覽器申明自己接收的字符集,這就是本文前面介紹的各種字符集和字符編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字符編碼方案);

  我們再看Response消息的結構, 和Request消息的結構基本一樣。 同樣也分爲三部分

  第一部分叫Response line,

  第二部分叫Response header,

  第三部分是body. header和body之間也有個空行,

  結構如下圖

   

 HTTP/version-number表示HTTP協議的版本號,  status-code 和message 請看下節[狀態代碼]的詳細解釋.

  我們用Fiddler 捕捉一個博客園首頁的Response然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Response的消息,   如下圖

Cache-Control

作用: 這個是非常重要的規則。 這個用來指定Response-Request遵循的緩存機制。各個指令含義如下

Cache-Control:Public   可以被任何緩存所緩存()

Cache-Control:Private     內容只緩存到私有緩存中

Cache-Control:no-cache  所有內容都不會被緩存

還有其他的一些用法, 我沒搞懂其中的意思, 請大家參考其他的資料

Content-Type

作用:WEB服務器告訴瀏覽器自己響應的對象的類型和字符集,

例如:

Content-Type: text/html; charset=utf-8

Content-Type:text/html;charset=GB2312

Content-Type: image/jpeg

Expires

作用: 瀏覽器會在指定過期時間內使用本地緩存

例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

Last-Modified:

作用: 用於指示資源的最後修改日期和時間。(實例請看上節的If-Modified-Since的實例)

例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

Server:

作用:指明HTTP服務器的軟件信息

例如:Server: Microsoft-IIS/7.5

X-AspNet-Version:

作用:如果網站是用ASP.NET開發的,這個header用來表示ASP.NET的版本

例如: X-AspNet-Version: 4.0.30319

X-Powered-By:

作用:表示網站是用什麼技術開發的

例如: X-Powered-By: ASP.NET

Connection

例如: Connection: keep-alive   當一個網頁打開完成後,客戶端和服務器之間用於傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接.

例如:  Connection: close  代表一個Request完成後,客戶端和服務器之間用於傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

Content-Length

指明實體正文的長度,以字節方式存儲的十進制數字來表示。在數據下行的過程中,Content-Length的方式要預先在服務器中緩存所有數據,然後所有數據再一股腦兒地發給客戶端。

例如: Content-Length: 19847

 Date

作用:  生成消息的具體時間和日期

例如: Date: Sat, 11 Feb 2012 11:35:14 GMT

HTTP協議之Get和Post

        Http協議定義了很多與服務器交互的方法,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用於描述一個網絡上的資源,而HTTP中的GET, POST, PUT, DELETE就對應着對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用於獲取/查詢資源信息,而POST一般用於更新資源信息.

       我們看看GET和POST的區別

       1. GET提交的數據會放在URL之後,以?分割URL和傳輸數據,參數之間以&相連,如EditPosts.aspx?name=test1&id=123456.  POST方法是把提交的數據放在HTTP包的Body中.

       2. GET提交的數據大小有限制(因爲瀏覽器對URL的長度有限制),而POST方法提交的數據沒有限制.

       3. GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值,也就是說Get是通過地址欄來傳值,而Post是通過提交表單來傳值。

       4. GET方式提交數據,會帶來安全問題,比如一個登錄頁面,通過GET方式提交數據時,用戶名和密碼將出現在URL上,如果頁面可以被緩存或者其他人可以訪問這臺機器,就可以從歷史記錄獲得該用戶的賬號和密碼.

       

     HTPPS

     HTTPS(全稱:Hypertext Transfer Protocol over Secure Socket Layer),是以安全爲目標的HTTP通道,簡單講是HTTP的安全版。即HTTP下加入SSL層,HTTPS的安全基礎是SSL,因此加密的詳細內容就需要SSL。 它是一個URI scheme(抽象標識符體系),句法類同http:體系。用於安全的HTTP數據傳輸。https:URL表明它使用了HTTP,但HTTPS存在不同於HTTP的默認端口及一個加密/身份驗證層(在HTTP與TCP之間)。這個系統的最初研發由網景公司進行,提供了身份驗證與加密通訊方法,現在它被廣泛用於萬維網上安全敏感的通訊,例如交易支付方面。


HTTPS和HTTP的區別:

  https協議需要到ca申請證書,一般免費證書很少,需要交費。

  http是超文本傳輸協議,信息是明文傳輸,https 則是具有安全性的ssl加密傳輸協議 http和https使用的是完全不同的連接方式用的端口也不一樣:前者是80,後者是443。

  http的連接很簡單,是無狀態的 HTTPS協議是由SSL+HTTP協議構建的可進行加密傳輸、身份認證的網絡協議 要比http協議安全 HTTPS解決的問題:

  1、信任主機的問題。 採用https 的server 必須從CA 申請一個用於證明服務器用途類型的證書。

  改證書只有用於對應的server 的時候,客戶度纔信任次主機。所以目前所有的銀行系統網站,關鍵部分應用都是https 的。 客戶通過信任該證書,從而信任了該主機。其實這樣做效率很低,但是銀行更側重安全。 這一點對我們沒有任何意義,我們的server,採用的證書不管自己issue 還是從公衆的地方issue, 客戶端都是自己人,所以我們也就肯定信任該server。

  2、通訊過程中的數據的泄密和被竄改。

  1)一般意義上的https, 就是 server 有一個證書。

  a) 主要目的是保證server 就是他聲稱的server。這個跟第一點一樣。

  b) 服務端和客戶端之間的所有通訊,都是加密的。

  i、具體講,是客戶端產生一個對稱的密鑰,通過server 的證書來交換密鑰。 一般意義上的握手過程。

  ii、加下來所有的信息往來就都是加密的。 第三方即使截獲,也沒有任何意義。因爲他沒有密鑰。 當然竄改也就沒有什麼意義了。

  2)少許對客戶端有要求的情況下,會要求客戶端也必須有一個證書。

  a) 這裏客戶端證書,其實就類似表示個人信息的時候,除了用戶名/密碼, 還有一個CA 認證過的身份。 應爲個人證書一般來說上別人無法模擬的,所有這樣能夠更深的確認自己的身份。

  b) 目前少數個人銀行的專業版是這種做法,具體證書可能是拿U盤作爲一個備份的載體。像我用的交通銀行的網上銀行就是採取的這種方式。 HTTPS 一定是繁瑣的。

  a) 本來簡單的http協議,一個get一個response。由於https 要還密鑰和確認加密算法的需要。單握手就需要6/7 個往返。

  i、任何應用中,過多的round trip 肯定影響性能。

  b) 接下來纔是具體的http協議,每一次響應或者請求, 都要求客戶端和服務端對會話的內容做加密/解密。

  i、儘管對稱加密/解密效率比較高,可是仍然要消耗過多的CPU,爲此有專門的SSL 芯片。 如果CPU 信能比較低的話,肯定會降低性能,從而不能serve 更多的請求。

  符:SSL的簡介:

  SSL是Netscape公司所提出的安全保密協議,在瀏覽器(如Internet Explorer、Netscape Navigator)和Web服務器(如Netscape的Netscape Enterprise Server、ColdFusion Server等等)之間構造安全通道來進行數據傳輸,SSL運行在TCP/IP層之上、應用層之下,爲應用程序提供加密數據通道,它採用了RC4、MD5 以及RSA等加密算法,使用40 位的密鑰,適用於商業信息的加密。

  同時,Netscape公司相應開發了HTTPS協議並內置於其瀏覽器中,HTTPS實際上就是SSL over HTTP,它使用默認端口443,而不是像HTTP那樣使用端口80來和TCP/IP進行通信。HTTPS協議使用SSL在發送方把原始數據進行加密,然 後在接受方進行解密,加密和解密需要發送方和接受方通過交換共知的密鑰來實現,因此,所傳送的數據不容易被網絡黑客截獲和解密。

  然而,加密和解密過程需要耗費系統大量的開銷,嚴重降低機器的性能,相關測試數據表明使用HTTPS協議傳輸數據的工作效率只有使用HTTP協議傳輸的十 分之一。

  假如爲了安全保密,將一個網站所有的Web應用都啓用SSL技術來加密,並使用HTTPS協議進行傳輸,那麼該網站的性能和效率將會大大降低,而且沒有這個必要,因爲一般來說並不是所有數據都要求那麼高的安全保密級別,所以,我們只需對那些涉及機密數據的交互處理使用HTTPS協議,這樣就做到魚與熊掌兼得。總之不需要用https 的地方,就儘量不要用。














發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章