TCP面試題

TCP爲什麼建立連接需要三次握手,而斷開連接則需要四次?
1 TCP包概述

一個 segment 包含 header 和 data 兩個部分,對於這篇文章需要理解的就是,Sequence number 和 Acknowledgement number) 這兩個字段。TCP 的可靠傳輸就是基於這兩個字段來實現的。 雖然文章的主旨是三次握手(three-way handshake)與四次揮手(four-way handshake),但不理解 Sequence number 和 Acknowledgement number 就無法真正的理解這兩個過程。

Sequence number

當開始一個 TCP 會話時,此時 SYN 位爲 1,會生成一個隨機的 Sequence number,後續使用 Sequence number 則從 Sequence number + 1 開始。

其他時候,則表示爲 data 部分第一位的位置,值爲此位數據的 Sequence number ,即基於初始 Sequence number + 1 + offset。

其實很好理解,我們先拋開第一次生成的 Sequence number,後續的 TCP 頭中的 Sequence number 都指的是 data 部分第一位的序號。比如:

我這次發送的 Sequence number 爲 100,數據長度爲 100,

那麼我下一次發送的 Sequence number 就應該是 200,再假定數據長度爲 50,

如果要進行第三次發送,那麼 Sequence number 的值應爲 250。

下面的圖簡單的表明了發送兩個連續的 segment 的 Sequence number 變化情況,忽略了TCP頭,TCP頭 並不計入 Length

Acknowledgement number

回覆收到的最大 Sequence number + 1,表示期望收到的 Sequence number 的值。

和上面的其實一樣的道理,比如收到 Sequence number 爲 100,數據長度爲 100,那麼我們就回復 Acknowledgement number = 200。

2 三次握手過程概述

有了上面的基礎,我們再開始看握手過程,TCP連接三次握手的過程如下,爲了方便描述:

SEQ_NUM 代表 TCP header 中的 Sequence number

ACK_NUM 代表 TCP header 中的 Acknowledgment number

DATA_LEN 代表 segment 中 data 的長度

SYN(1) ACK(0) SEQ_NUM(0) ACK_NUM(0) DATA_LEN(0) >
<
SYN(1) ACK(1) SEQ_NUM(100) ACK_NUM(1) DATA_LEN(0)
SYN(0) ACK(1) SEQ_NUM(1) ACK_NUM(101) DATA_LEN(0) ====>
連接發起方將 SYN 位設置爲1,然後隨機生成一個 SEQ_NUM_A,發送給被髮起方。
被髮起方回覆 ACK(1) ACK_NUM(SEQ_NUM_A+1),同時也需將 SYN 位設置爲1,然後自己也隨機生成一個 SEQ_NUM_B。
連接發起方收到上個 segment 後,回覆 ACK(1) ACK_NUM(SEQ_NUM_B+1),當被髮起方收到這個 segment 後,連接建立成功。

3 可能存在的疑問

1、爲什麼要強調 Sequence number 和 Acknowledgement number?

假設同樣是三次握手,但是很簡單:

SYN(1) ACK(0) >
<
SYN(1) ACK(1)
SYN(0) ACK(1) ====>
看起來沒問題,但實際上由於網絡傳輸是不可靠的,如果沒有 Sequence number 我們無法保證此時收到的 segment 的順序性,也無法得知是否丟失了某個 segment。同樣是一個 SYN(1) ACK(1) segment,它有可能是上一次建立連接時被髮送方誤認爲已經丟失的 segment,甚至更特殊的情況。

在數據傳輸的過程中也是如此,被重發的 segment,丟失的 segment,連續發送的 100 個 segment 如果沒有 Sequence number 作爲保障,他們到達(或者到達不了)接收方的排列組合方式可能千奇百怪。

2、那麼在 Sequence number 和 Acknowledgement number 的保障下,如何保證自己的消息被對方收到呢?

這個其實很好理解,實際上就是自己發送出去的這部分 Sequence number 被 ack 了即可,即:一去一回(實際上可以多去一回,或者可能一去多回,但這裏只說最簡單的情況)。

SEQ_NUM(100) DATA_LEN(100) >
<
ACK(200)
如果沒有收到對方的 ack,或者收到的 ack 非此 segment 的 ack,則代表對方沒有收到自己的消息,比如下面這個例子,此時我們能得知,對方沒有收到或者暫時還沒收到我們發送過去的第二個 segment。

此時也可以區分出收到的 segment 是否屬於本次連接,因爲在建立連接後我們會生成一個新的 Sequence number。

SEQ_NUM(100) DATA_LEN(100) >
<
ACK(200)
SEQ_NUM(200) DATA_LEN(100) >
<
ACK(200)
3、這就很好理解 TCP 連接握手爲什麼是三次了。

發起連接方發出SYN,並收到ACK,這就是兩次網絡傳輸了。

同樣被連接方也發出SYN,且等待對方回覆,這也是兩次網絡傳輸。

加起來難道不是四次嗎?實際上被連接方將對連接方 SYN(1) 的回覆和自己 SYN(1) 的請求合併了,所以建立一個 TCP 連接最少只需要經過三次網絡傳輸。

4、那爲什麼 TCP 斷開連接需要四次,而不是三次?

發起斷開方發出FIN,並收到ACK,這就是兩次網絡傳輸了。

同樣被斷開方也發出FIN,且等待對方回覆,這也是兩次網絡傳輸。

同樣的邏輯分析下來,實際上也可以僅經過三次傳輸就斷開此次連接,但爲什麼我們會說四次揮手呢?這是因爲如果在收到FIN時,彼時還有數據未傳輸完,則先回復關於 FIN 的 ACK,告知對方我已經知道你要斷開了。則等待傳輸完畢後,被斷開方再發送 FIN,告知自己也已經可以斷開連接。

但實際上完全可以是“三次揮手”,如果收到 FIN 時,已經沒有數據要傳輸,則是“三次揮手”。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章