又被鵝廠問懵逼了!

大家好,我是小林。

收到個讀者的問題,他在面試鵝廠的時候,被搞懵了,因爲面試官問了他這麼一個網絡問題:


不得不說,鵝廠真的很喜歡問網絡問題,而且愛問異常情況下的網絡問題,之前也有篇另外一個讀者面試鵝廠的網絡問題:「被鵝廠面怕了!」。

 

不過這道鵝廠的網絡題可能是提問的讀者表述有問題,因爲如果 FIN 報文比數據包先抵達客戶端,此時 FIN 報文其實是一個亂序的報文,此時客戶端的 TCP 連接並不會從 FIN_WAIT_2 狀態轉換到 TIME_WAIT 狀態


因此,我們要關注到點是看「在 FIN_WAIT_2 狀態下,是如何處理收到的亂序到 FIN 報文,然後 TCP 連接又是什麼時候才進入到 TIME_WAIT 狀態?」。

 

我這裏先直接說結論:

在 FIN_WAIT_2 狀態時,如果收到亂序的 FIN 報文,那麼就被會加入到「亂序隊列」,並不會進入到 TIME_WAIT 狀態。

等再次收到前面被網絡延遲的數據包時,會判斷亂序隊列有沒有數據,然後會檢測亂序隊列中是否有可用的數據,如果能在亂序隊列中找到與當前報文的序列號保持的順序的報文,就會看該報文是否有 FIN 標誌,如果發現有 FIN 標誌,這時纔會進入 TIME_WAIT 狀態。

我也畫了一張圖,大家可以結合着圖來理解。

TCP 源碼分析

接下來,我帶大家看看源碼,聽到要源碼分析,可能有的同學就慫了。

其實要分析我們今天這個問題,只要懂 if else 就行了,我也會用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。

這次我們重點分析的是,在 FIN_WAIT_2 狀態下,收到 FIN 報文是如何處理的。

在 Linux 內核裏,當 IP 層處理完消息後,會通過回調 tcp_v4_rcv 函數將消息轉給 TCP 層,所以這個函數就是 TCP 層收到消息的入口。


處於 FIN_WAIT_2 狀態下的客戶端,在收到服務端的報文後,最終會調用 tcp_v4_do_rcv 函數。

 

接下來,tcp_v4_do_rcv 方法會調用 tcp_rcv_state_process,在這裏會根據 TCP 狀態做對應的處理,這裏我們只關注 FIN_WAIT_2 狀態。

在上面這個代碼裏,可以看到如果 shutdown 關閉了讀方向,那麼在收到對方發來的數據包,則會回覆 RST 報文。

而我們這次的題目裏, shutdown 只關閉了寫方向,所以會繼續往下調用 tcp_data_queue 函數(因爲 case TCP_FIN_WAIT2 代碼塊裏並沒有 break 語句,所以會走到該函數)。


在上面的 tcp_data_queue 函數裏,如果收到的報文的序列號是我們預期的,也就是有序的話:

 

  • 會判斷該報文有沒有 FIN 標誌,如果有的話就會調用 tcp_fin 函數,這個函數負責將 FIN_WAIT_2 狀態轉換爲 TIME_WAIT。
  • 接着還會看亂序隊列有沒有數據,如果有的話會調用 tcp_ofo_queue 函數,這個函數負責檢查亂序隊列中是否有數據包可用,即能不能在亂序隊列找到與當前數據包保持序列號連續的數據包。

而當收到的報文的序列號不是我們預期的,也就是亂序的話,則調用 tcp_data_queue_ofo 函數,將報文加入到亂序隊列,這個隊列的數據結構是紅黑樹。

我們的題目裏,客戶端收到的 FIN 報文實際上是一個亂序的報文,因此此時並不會調用 tcp_fin 函數進行狀態轉換,而是將報文通過 tcp_data_queue_ofo 函數加入到亂序隊列。

然後當客戶端收到被網絡延遲的數據包後,此時因爲該數據包的序列號是期望的,然後又因爲上一次收到的亂序 FIN 報文被加入到了亂序隊列,表明亂序隊列是有數據的,於是就會調用 tcp_ofo_queue 函數。

我們來看看 tcp_ofo_queue 函數。

在上面的 tcp_ofo_queue 函數裏,在亂序隊列中找到能與當前報文的序列號保持的順序的報文後,會看該報文是否有 FIN 標誌,如果有的話,就會調用 tcp_fin() 函數。

最後,我們來看看 tcp_fin 函數的處理。


可以看到,如果當前的 TCP 狀態爲 TCP_FIN_WAIT2,就會發送第四次揮手 ack,然後調用 tcp_time_wait 函數,這個函數裏會將 TCP 狀態變更爲 TIME_WAIT,並啓動 TIME_WAIT 的定時器。

 

怎麼看 TCP 源碼?

之前有不少同學問我,我是怎麼看 TCP 源碼的?

其實我看 TCP 源碼,並不是直接打開 Linux 源碼直接看,因爲 Linux 源碼實在太龐大了,如果我不知道 TCP 入口函數在哪,那簡直就是大海撈針。

所以,在看 TCP 源碼,我們可以去網上搜索下別人的源碼分析,網上已經有很多前輩幫我們分析了 TCP 源碼了,而且各個函數的調用鏈路,他們都有寫出來了。

比如,你想了解 TCP 三次握手/四次揮手的源碼實現,你就可以以「TCP 三次握手/四次揮手的源碼分析」這樣關鍵字來搜索,大部分文章的註釋寫的還是很清晰,我最開始就按這種方式來學習 TCP 源碼的。

網上的文章一般只會將重點的部分,很多代碼細節沒有貼出來,如果你想完整的看到函數的所有代碼,那就得看內核代碼了。

這裏推薦個看 Linux 內核代碼的在線網站:

https://elixir.bootlin.com/linux/latest/source

我覺得還是挺好用的,左側各個版本的代碼都有,右上角也可以搜索函數。

所以,我看 TCP 源碼的經驗就是,先在網上找找前輩寫的 TCP 源碼分析,然後知道整個函數的調用鏈路後,如果想具體瞭解某個函數的具體實現,可以在我說的那個看 Linux 內核代碼的在線網站上搜索該函數,就可以看到完整的函數的實現。如果中途遇到看不懂的代碼,也可以將這個代碼複製到百度或者谷歌搜索,一般也能找到別人分析的過程。

學會了看 TCP 源碼其實有助於我們分析一些異常問題,就比如今天這道網絡題目,在網上其實是搜索不出答案的,而且我們也很難用實驗的方式來模擬。

所以要想知道答案,只能去看源碼。


這次就說到這啦,我們下次見!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章