TCP socket 中的長連接與短連接的區別

1. TCP連接

當網絡通信時採用TCP協議時,在真正的讀寫操作之前,server與client之間必須建立一個連接,當讀寫操作完成後,雙方不再需要這個連接時它們可以釋放這個連接,連接的建立是需要三次握手的,而釋放則需要4次握手,所以說每個連接的建立都是需要資源消耗和時間消耗的

經典的三次握手示意圖:

經典的四次握手關閉圖:

2. TCP短連接

首先模擬一下TCP短連接的情況,client向server發起連接請求,server接到請求,然後雙方建立連接。client向server發送消息,server迴應client,然後一次讀寫就完成了,這時候雙方任何一個都可以發起close操作,不過一般都是client先發起close操作。爲什麼呢,一般的server不會回覆完client後立即關閉連接的,當然不排除有特殊的情況。從上面的描述看,短連接一般只會在client/server間傳遞一次讀寫操作。

連接→數據傳輸→關閉連接

短連接的優點是:管理起來比較簡單,存在的連接都是有用的連接,不需要額外的控制手段

3.TCP長連接

接下來再模擬一下長連接的情況,client向server發起連接,server接受client連接,雙方建立連接。Client與server完成一次讀寫之後,它們之間的連接並不會主動關閉,後續的讀寫操作會繼續使用這個連接。

 連接→數據傳輸→保持連接(心跳)→數據傳輸→保持連接(心跳)→……→關閉連接(一個TCP連接通道多個讀寫通信) 
      這就要求長連接在沒有數據通信時,定時發送數據包(心跳),以維持連接狀態

首先說一下TCP/IP詳解上講到的TCP保活功能,保活功能主要爲服務器應用提供,服務器應用希望知道客戶主機是否崩潰,從而可以代表客戶使用資源。如果客戶已經消失,使得服務器上保留一個半開放的連接,而服務器又在等待來自客戶端的數據,則服務器將應遠等待客戶端的數據,保活功能就是試圖在服務器端檢測到這種半開放的連接。

如果一個給定的連接在兩小時內沒有任何的動作,則服務器就向客戶發一個探測報文段,客戶主機必須處於以下4個狀態之一:

  1. 客戶主機依然正常運行,並從服務器可達。客戶的TCP響應正常,而服務器也知道對方是正常的,服務器在兩小時後將保活定時器復位。
  2. 客戶主機已經崩潰,並且關閉或者正在重新啓動。在任何一種情況下,客戶的TCP都沒有響應。服務端將不能收到對探測的響應,並在75秒後超時。服務器總共發送10個這樣的探測 ,每個間隔75秒。如果服務器沒有收到一個響應,它就認爲客戶主機已經關閉並終止連接。
  3. 客戶主機崩潰並已經重新啓動。服務器將收到一個對其保活探測的響應,這個響應是一個復位,使得服務器終止這個連接。
  4. 客戶機正常運行,但是服務器不可達,這種情況與2類似,TCP能發現的就是沒有收到探查的響應。

從上面可以看出,TCP保活功能主要爲探測長連接的存活狀況,不過這裏存在一個問題,存活功能的探測週期太長,還有就是它只是探測TCP連接的存活,屬於比較斯文的做法,遇到惡意的連接時,保活功能就不夠使了。

在長連接的應用場景下,client端一般不會主動關閉它們之間的連接,Client與server之間的連接如果一直不關閉的話,會存在一個問題,隨着客戶端連接越來越多,server早晚有扛不住的時候,這時候server端需要採取一些策略,如關閉一些長時間沒有讀寫事件發生的連接,這樣可以避免一些惡意連接導致server端服務受損;如果條件再允許就可以以客戶端機器爲顆粒度,限制每個客戶端的最大長連接數,這樣可以完全避免某個蛋疼的客戶端連累後端服務。

長連接和短連接的產生在於client和server採取的關閉策略,具體的應用場景採用具體的策略,沒有十全十美的選擇,只有合適的選擇。

3. 應用場景:

     長連接多用於操作頻繁(讀寫),點對點的通訊,而且連接數不能太多情況,。每個TCP連接都需要三步握手,這需要時間,如果每個操作都是先連接,再操作的話那麼處理速度會降低很多,所以每個操作完後都不斷開,次處理時直接發送數據包就OK了,不用建立TCP連接。例如:數據庫的連接用長連接, 如果用短連接頻繁的通信會造成socket錯誤,而且頻繁的socket 創建也是對資源的浪費。

     而像WEB網站的http服務一般都用短鏈接(http1.0只支持短連接,1.1keep alive 帶時間,操作次數限制的長連接),因爲長連接對於服務端來說會耗費一定的資源,而像WEB網站這麼頻繁的成千上萬甚至上億客戶端的連接用短連接會更省一些資源,如果用長連接,而且同時有成千上萬的用戶,如果每個用戶都佔用一個連接的話,那可想而知吧。所以併發量大,但每個用戶無需頻繁操作情況下需用短連好;

     在長連接中一般是沒有條件能夠判斷讀寫什麼時候結束,所以必須要加長度報文頭。讀函數先是讀取報文頭的長度,再根據這個長度去讀相應長度的報文。

4. 報文格式:

通信報文格式多樣性更多,相應地就必須設計對應的讀寫報文的接 收和發送報文函數。

阻塞與非阻塞方式

非阻塞方式:讀函數不停的進行讀動作,如果沒有報文接收到,等待一段時間後超時返回,

這種情況一般需要指定超時時間。

阻塞方式:如果沒有接收到報文,則讀函數一直處於等待狀態,知道報文到達。

循環讀寫方式

1. 一次直接讀寫報文:在一次接收或發送報文動作中一次性不加分別地全部讀取或全部發送報文字節。

2. 不指定長度循環讀寫:這一版發生在短連接進程中,受網絡路由等限制,一次較長的報文可能在網絡傳輸過程中被分解成很多個包,一次讀取可能不能全部讀完一次報文,這就需要循環讀取報文,直到讀完爲止。

3. 帶長度報文頭循環讀寫:這種情況一般在長連接中,由於在長連接中沒有條件能夠判斷循環讀寫什麼時候結束。

     必須要加長度報文頭。讀函數先是讀取報文頭的長度,再根據這個長度去讀報文,實際情況中,報頭碼制格式還經常不一樣,

如果是非ASCII的報文頭,還必須轉換成ASCII常見的報文頭編制有:

1. n個字節的ASCII碼。

2. n個字節的BCD碼。

3. n個字節的網絡整型碼。

以上是幾種比較典型的讀寫報文方式,可以與通信方式模板一起 預先提供一些典型的API讀寫函數。

當然在實際問題中,可能還必須編寫與對方報文格式配套的讀寫API. 在實際情況中,往往需要把我們自己的系統與別人的系統進行連接, 有了以上模板與API,可以說連接任何方式的通信程序都不存在問題。

 

參考鏈接:

 http://www.cnblogs.com/liuyong/archive/2011/07/01/2095487.html 

https://www.cnblogs.com/qqzy168/p/3141703.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章