一泡尿的時間,快速搞懂TCP和UDP的區別

本文引用了作者Fundebug的“一文搞懂TCP與UDP的區別”一文的內容,感謝無私分享。

1、引言

網絡協議是每個搞網絡通信應用開發(比如IM、推送、網關等等)的程序員都必須要掌握的基礎知識,TCP/IP協議簇中有兩個最具有代表性的傳輸層協議——分別是 TCP 和 UDP。

有過網絡通信開發經驗的同學們都知道,TCP和UDP協議是平時用的最多的兩種協議,而對於很多人來說,什麼時候以及什麼場景下該用TCP還是UDP?這是個經久不息的討論話題。

不同於其它長篇大論,本文儘量以簡潔精煉的文字,幫你總結歸納TCP和UDP協議的主要區別,方便那些想掌握這方面知識又不願意耗費太多時間去系統地學習網絡理論基礎的同學快速理解!

 
推薦閱讀:爲了加深理解,本系列的另一篇《   網絡編程懶人入門(四):快速理解TCP和UDP的差異》也可以一併閱讀。

2、快速理解TCP/IP協議簇

計算機與網絡設備要相互通信,雙方就必須基於相同的方法。比如:如何探測到通信目標、由哪一邊先發起通信、使用哪種語言進行通信、怎樣結束通信等規則都需要事先確定。不同的硬件、操作系統之間的通信,所有的這一切都需要一種規則。而我們就把這種規則稱爲協議(protocol)。

TCP/IP 是互聯網相關的各類協議族的總稱,比如:TCP,UDP,IP,FTP,HTTP,ICMP,SMTP 等都屬於 TCP/IP 族內的協議。

TCP/IP模型是互聯網的基礎,它是一系列網絡協議的總稱。這些協議可以劃分爲四層,分別爲鏈路層、網絡層、傳輸層和應用層。

具體是:

  • 1)鏈路層:負責封裝和解封裝IP報文,發送和接受ARP/RARP報文等;
  • 2)網絡層:負責路由以及把分組報文發送給目標網絡或主機;
  • 3)傳輸層:負責對報文進行分組和重組,並以TCP或UDP協議格式封裝報文;
  • 4)應用層:負責向用戶提供應用程序,比如HTTP、FTP、Telnet、DNS、SMTP等。

下面這張表格進行了了歸納:

下面這張圖,更生動的反映了TCP/IP協議族的關係情況(高清圖從這裏下載):

在網絡體系結構中,網絡通信的建立必須是在通信雙方的對等層進行,不能交錯。

在整個數據傳輸過程中,數據在發送端時經過各層時都要附加上相應層的協議頭和協議尾(僅數據鏈路層需要封裝協議尾)部分,也就是要對數據進行協議封裝,以標識對應層所用的通信協議。

有關TCP/IP協議簇的知識,幾本書都寫不完,這裏我就不再贅述了,有興趣可以讀一讀《TCP/IP詳解 卷1:協議(在線閱讀)》。

另外,學習知識,我特別喜歡瞭解技術之外的一些知識,比如下面兩篇:

  1. 技術往事:改變世界的TCP/IP協議(珍貴多圖、手機慎點)
  2. 5G時代已經到來,TCP/IP老矣,尚能飯否?

接下來,我們將回到正題,學習TCP/IP 中有兩個具有代表性的傳輸層協議——TCP 和 UDP。

3、快速理解UDP協議

3.1 基本介紹

UDP協議:全稱是用戶數據報協議,在網絡中它與TCP協議一樣用於處理數據包,是一種無連接的協議。

在OSI模型中,處在第四層——傳輸層,處於IP協議的上一層(見下圖)。

▲ 上圖引用自《計算機網絡通訊協議關係圖

UDP有不提供數據包分組、組裝和不能對數據包進行排序的缺點,也就是說,當報文發送之後,是無法得知其是否安全完整到達的。

UDP協議的幾個主要特別,我進行歸納,下面的下節將逐一說明。

3.2 面向無連接

首先 UDP 是不需要和 TCP一樣在發送數據前進行三次握手建立連接的,想發數據就可以開始發送了。並且也只是數據報文的搬運工,不會對數據報文進行任何拆分和拼接操作。

具體來說就是:

  • 1)在發送端:應用層將數據傳遞給傳輸層的 UDP 協議,UDP 只會給數據增加一個 UDP 頭標識下是 UDP 協議,然後就傳遞給網絡層了;
  • 2)在接收端:網絡層將數據傳遞給傳輸層,UDP 只去除 IP 報文頭就傳遞給應用層,不會任何拼接操作。

3.3 支持單播、多播、廣播

UDP 不止支持一對一的傳輸方式,同樣支持一對多,多對多,多對一的方式,也就是說 UDP 提供了單播、多播、廣播的功能。

3.4 面向報文

UDP協議是面向報文的。

發送方的UDP對應用程序交下來的報文,在添加首部後就向下交付IP層。UDP對應用層交下來的報文,既不合並,也不拆分,而是保留這些報文的邊界。

因此,應用程序必須選擇合適大小的報文(見《UDP中一個包的大小最大能多大?》)。

3.5 不可靠性

UDP的不可靠性首先體現在無連接上,通信的雙方不需要建立連接,想發就發,這樣的情況肯定不可靠。

並且收到什麼數據就傳遞什麼數據,並且也不會備份數據,發送數據也不會關心對方是否已經正確接收到數據了。

再者網絡環境時好時壞,但是 UDP 因爲沒有擁塞控制,一直會以恆定的速度發送數據(即使網絡條件不好,也不會對發送速率進行調整)。

這樣實現的弊端就是在網絡條件不好的情況下可能會導致丟包,但是優點也很明顯,在某些實時性要求高的場景(比如電話會議)就需要使用 UDP 而不是 TCP(見《網絡編程懶人入門(五):快速理解爲什麼說UDP有時比TCP更有優勢》)。

下面這個動圖可以很好的說明UDP的不可靠性:

從上面的動圖可以得知,UDP只會把想發的數據報文一股腦的丟給對方,並不在意數據有無安全完整到達。

3.6 頭部開銷小

UDP協議頭部開銷小(如下圖所示),傳輸數據報文時是很高效的。

▲ 上圖引用自《TCP/IP詳解 - 第11章·UDP協議

UDP 頭部包含了以下幾個數據:

  • 1)兩個十六位的端口號,分別爲源端口(可選字段)和目標端口;
  • 2)整個數據報文的長度;
  • 3)整個數據報文的檢驗和(IPv4 可選 字段),該字段用於發現頭部信息和數據中的錯誤。

因此 UDP 的頭部開銷小,只有8字節,相比 TCP 的至少20字節要少得多,在傳輸數據報文時是很高效的。

作爲對比,下圖是TCP協議的頭部開銷:

▲ 上圖引用自《TCP/IP詳解 - 第17章·TCP協議

3.7 更全面地學習UDP協議

UDP協議相對來說比較簡單易學,如果覺得理論上有所欠缺,可以通過網絡經典書籍《TCP/IP詳解 - 第11章·UDP:用戶數據報協議》中的章節來補充。

其實生產應用時,UDP協議也有它複雜的一面,下面這幾篇值得學習一下:

  1. 不爲人知的網絡編程(五):UDP的連接性和負載均衡
  2. 不爲人知的網絡編程(六):深入地理解UDP協議並用好它
  3. 不爲人知的網絡編程(七):如何讓不可靠的UDP變的可靠?

另外,隨着近年來Google等互聯網大廠大力推廣Quic協議,UDP協議在新時代移動互聯網環境下或許能找到更多的應用場景,有興趣的讀者可以學習一下QUIC協議:《網絡編程懶人入門(十):一泡尿的時間,快速讀懂QUIC協議》、《技術掃盲:新一代基於UDP的低延時網絡傳輸層協議——QUIC詳解》、《讓互聯網更快:新一代QUIC協議在騰訊的技術實踐分享》。

4、快速理解TCP協議

4.1 基本介紹

當一臺計算機想要與另一臺計算機通訊時,兩臺計算機之間的通信需要暢通且可靠,這樣才能保證正確收發數據。

例如:當你想查看網頁或查看電子郵件時,希望完整且按順序查看網頁,而不丟失任何內容。當你下載文件時,希望獲得的是完整的文件,而不僅僅是文件的一部分,因爲如果數據丟失或亂序,都不是你希望得到的結果,於是就用到了TCP。

TCP協議:全稱是傳輸控制協議是一種面向連接的、可靠的、基於字節流的傳輸層通信協議,由 IETF 的RFC 793定義。

TCP 是面向連接的、可靠的流協議。流就是指不間斷的數據結構,你可以把它想象成排水管中的水流。

有關TCP協議的理論可以繼續閱讀《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》,限於篇幅這裏就展開了。

接下來我們逐個介紹TCP最主要的幾個特點。

4.2 TCP連接過程(3次握手)

如下圖所示,這是建立一個TCP連接的過程(俗稱“3次握手”):

1)第一次握手:客戶端向服務端發送連接請求報文段。該報文段中包含自身的數據通訊初始序號。請求發送後,客戶端便進入 SYN-SENT 狀態。

2)第二次握手:服務端收到連接請求報文段後,如果同意連接,則會發送一個應答,該應答中也會包含自身的數據通訊初始序號,發送完成後便進入 SYN-RECEIVED 狀態。

3)第三次握手:當客戶端收到連接同意的應答後,還要向服務端發送一個確認報文。客戶端發完這個報文段後便進入 ESTABLISHED 狀態,服務端收到這個應答後也進入 ESTABLISHED 狀態,此時連接建立成功。

這裏可能大家會有個疑惑:爲什麼 TCP 建立連接需要三次握手,而不是兩次?這是因爲這是爲了防止出現失效的連接請求報文段被服務端接收的情況,從而產生錯誤。

下面的動畫演示了3次握手過程,可能更好懂一些:

4.3 TCP斷開鏈接(4次揮手)

 

TCP 是全雙工的,如上圖所示,在斷開連接時兩端都需要發送 FIN 和 ACK。

1)第一次揮手:若客戶端 A 認爲數據發送完成,則它需要向服務端 B 發送連接釋放請求。

2)第二次揮手:B 收到連接釋放請求後,會告訴應用層要釋放 TCP 鏈接。然後會發送 ACK 包,並進入 CLOSE_WAIT 狀態,此時表明 A 到 B 的連接已經釋放,不再接收 A 發的數據了。但是因爲 TCP 連接是雙向的,所以 B 仍舊可以發送數據給 A。

3)第三次揮手:B 如果此時還有沒發完的數據會繼續發送,完畢後會向 A 發送連接釋放請求,然後 B 便進入 LAST-ACK 狀態。

4)第四次揮手:A 收到釋放請求後,向 B 發送確認應答,此時 A 進入 TIME-WAIT 狀態。該狀態會持續 2MSL(最大段生存期,指報文段在網絡中生存的時間,超時會被拋棄) 時間,若該時間段內沒有 B 的重發請求的話,就進入 CLOSED 狀態。當 B 收到確認應答後,也便進入 CLOSED 狀態。

關於TCP的4次揮手,下面的動畫或許更生動一些:

正確理解TCP 3次握手和4次揮手過程,是非常重要的,限於篇幅,本文沒辦法進一步深入展開,有興趣的同事可以進一步深入閱讀以幾篇專題文章:

  1. 腦殘式網絡編程入門(一):跟着動畫來學TCP三次握手和四次揮手
  2. 理論經典:TCP協議的3次握手與4次揮手過程詳解
  3. 理論聯繫實際:Wireshark抓包分析TCP 3次握手、4次揮手過程

4.4 TCP協議要點歸納

1)面向連接:

面向連接,是指發送數據之前必須在兩端建立連接。

建立連接的方法是“三次握手”,這樣能建立可靠的連接。建立連接,是爲數據的可靠傳輸打下了基礎。

2)僅支持單播傳輸:

每條TCP傳輸連接只能有兩個端點,只能進行點對點的數據傳輸,不支持多播和廣播傳輸方式。

3)面向字節流:

TCP不像UDP一樣那樣一個個報文獨立地傳輸,而是在不保留報文邊界的情況下以字節流方式進行傳輸。

4)可靠傳輸:

對於可靠傳輸、判斷丟包、誤碼,靠的是TCP的段編號以及確認號。

TCP爲了保證報文傳輸的可靠,就給每個包一個序號,同時序號也保證了傳送到接收端實體的包的按序接收。

然後接收端實體對已成功收到的字節發回一個相應的確認(ACK):如果發送端實體在合理的往返時延(RTT)內未收到確認,那麼對應的數據(假設丟失了)將會被重傳。

關於可靠傳輸的理論,可以深入學習《TCP/IP詳解 - 第21章·TCP的超時與重傳》,這裏就不深入展開了。

5)提供擁塞控制:

當網絡出現擁塞的時候,TCP能夠減小向網絡注入數據的速率和數量,緩解擁塞。

TCP中有關擁塞控制的文章通都比較枯燥,這篇《通俗易懂-深入理解TCP協議(下):RTT、滑動窗口、擁塞處理》相對來說講的比較易懂,有興趣可以深入讀讀。

6)TCP提供全雙工通信:

TCP允許通信雙方的應用程序在任何時候都能發送數據,因爲TCP連接的兩端都設有緩存,用來臨時存放雙向通信的數據。

當然,TCP可以立即發送一個數據段,也可以緩存一段時間以便一次發送更多的數據段(最大的數據段大小取決於MSS)。

4.5 更全面地學習TCP協議

TCP協議涉及的內容比較豐富,真要方方面面展來講,三天三夜也講不完。不過,對於網絡應用的開發者來說,根據自已應用所涉及技術的深度按需學習就可以了。

初學者建議先把理論夯實,比如從《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》這本經典書籍開始。

如果覺得理論太過乏味,下面這幾篇生動有趣的入門文章推薦一定要讀一讀:

  1. 網絡編程懶人入門(一):快速理解網絡通信協議(上篇)
  2. 網絡編程懶人入門(二):快速理解網絡通信協議(下篇)
  3. 網絡編程懶人入門(三):快速理解TCP協議一篇就夠
  4. 網絡編程懶人入門(六):史上最通俗的集線器、交換機、路由器功能原理入門
  5. 腦殘式網絡編程入門(一):跟着動畫來學TCP三次握手和四次揮手
  6. 網絡編程入門從未如此簡單(一):假如你來設計網絡,會怎麼做?
  7. 網絡編程入門從未如此簡單(二):假如你來設計TCP協議,會怎麼做?

5、總結一下

TCP和UDP的區別可以歸納爲下面這張表格:

簡單來說,TCP和UDP的區別就是:

  • 1)TCP向上層提供面向連接的可靠服務 ,UDP向上層提供無連接不可靠服務;
  • 2)雖然 UDP 並沒有 TCP 傳輸來的準確,但是也能在很多實時性要求高的地方有所作爲;
  • 3)對數據準確性要求高,速度可以相對較慢的,可以選用TCP。

最後,想用一張圖來生動地概括一下TCP與UDP的區別:

正如上圖所示:TCP就像左邊的妹子——喝起水來有條不紊、滴水不漏,UDP就像右邊的妹子——甭管能喝到多少、倒就完了。。。

學習交流:

- 移動端IM開發入門文章:《新手入門一篇就夠:從零開發移動端IM

- 開源IM框架源碼:https://github.com/JackJiang2011/MobileIMSDK 

本文已同步發佈於:http://www.52im.net/thread-3793-1-1.html )

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章