15.TCP長連接與短連接、心跳機制

轉自：

1. TCP連接

當網絡通信時採用TCP協議時，在真正的讀寫操作之前，server與client之間必須建立一個連接，當讀寫操作完成後，雙方不再需要這個連接時它們可以釋放這個連接，連接的建立是需要三次握手的，而釋放則需要4次握手，所以說每個連接的建立都是需要資源消耗和時間消耗的

經典的三次握手示意圖：

經典的四次握手關閉圖：

2. TCP短連接

我們模擬一下TCP短連接的情況，client向server發起連接請求，server接到請求，然後雙方建立連接。client向server發送消息，server迴應client，然後一次讀寫就完成了，這時候雙方任何一個都可以發起close操作，不過一般都是client先發起close操作。爲什麼呢，一般的server不會回覆完client後立即關閉連接的，當然不排除有特殊的情況。從上面的描述看，短連接一般只會在client/server間傳遞一次讀寫操作

短連接的優點是：管理起來比較簡單，存在的連接都是有用的連接，不需要額外的控制手段

3.TCP長連接

接下來我們再模擬一下長連接的情況，client向server發起連接，server接受client連接，雙方建立連接。Client與server完成一次讀寫之後，它們之間的連接並不會主動關閉，後續的讀寫操作會繼續使用這個連接。

首先說一下TCP/IP詳解上講到的TCP保活功能，保活功能主要爲服務器應用提供，服務器應用希望知道客戶主機是否崩潰，從而可以代表客戶使用資源。如果客戶已經消失，使得服務器上保留一個半開放的連接，而服務器又在等待來自客戶端的數據，則服務器將應遠等待客戶端的數據，保活功能就是試圖在服務器端檢測到這種半開放的連接。

如果一個給定的連接在兩小時內沒有任何的動作，則服務器就向客戶發一個探測報文段，客戶主機必須處於以下4個狀態之一：

客戶主機依然正常運行，並從服務器可達。客戶的TCP響應正常，而服務器也知道對方是正常的，服務器在兩小時後將保活定時器復位。
客戶主機已經崩潰，並且關閉或者正在重新啓動。在任何一種情況下，客戶的TCP都沒有響應。服務端將不能收到對探測的響應，並在75秒後超時。服務器總共發送10個這樣的探測，每個間隔75秒。如果服務器沒有收到一個響應，它就認爲客戶主機已經關閉並終止連接。
客戶主機崩潰並已經重新啓動。服務器將收到一個對其保活探測的響應，這個響應是一個復位，使得服務器終止這個連接。
客戶機正常運行，但是服務器不可達，這種情況與2類似，TCP能發現的就是沒有收到探查的響應。

從上面可以看出，TCP保活功能主要爲探測長連接的存活狀況，不過這裏存在一個問題，存活功能的探測週期太長，還有就是它只是探測TCP連接的存活，屬於比較斯文的做法，遇到惡意的連接時，保活功能就不夠使了。

在長連接的應用場景下，client端一般不會主動關閉它們之間的連接，Client與server之間的連接如果一直不關閉的話，會存在一個問題，隨着客戶端連接越來越多，server早晚有扛不住的時候，這時候server端需要採取一些策略，如關閉一些長時間沒有讀寫事件發生的連接，這樣可以避免一些惡意連接導致server端服務受損；如果條件再允許就可以以客戶端機器爲顆粒度，限制每個客戶端的最大長連接數，這樣可以完全避免某個蛋疼的客戶端連累後端服務。

長連接和短連接的產生在於client和server採取的關閉策略，具體的應用場景採用具體的策略，沒有十全十美的選擇，只有合適的選擇。

轉自：http://www.nowamagic.net/academy/detail/23350382

心跳包

很多應用層協議都有HeartBeat機制，通常是客戶端每隔一小段時間向服務器發送一個數據包，通知服務器自己仍然在線，並傳輸一些可能必要的數據。使用心跳包的典型協議是IM，比如QQ/MSN/飛信等協議。

心跳包之所以叫心跳包是因爲：它像心跳一樣每隔固定時間發一次，以此來告訴服務器，這個客戶端還活着。事實上這是爲了保持長連接，至於這個包的內容，是沒有什麼特別規定的，不過一般都是很小的包，或者只包含包頭的一個空包。

在TCP的機制裏面，本身是存在有心跳包的機制的，也就是TCP的選項：SO_KEEPALIVE。系統默認是設置的2小時的心跳頻率。但是它檢查不到機器斷電、網線拔出、防火牆這些斷線。而且邏輯層處理斷線可能也不是那麼好處理。一般，如果只是用於保活還是可以的。

心跳包一般來說都是在邏輯層發送空的echo包來實現的。下一個定時器，在一定時間間隔下發送一個空包給客戶端，然後客戶端反饋一個同樣的空包回來，服務器如果在一定時間內收不到客戶端發送過來的反饋包，那就只有認定說掉線了。

其實，要判定掉線，只需要send或者recv一下，如果結果爲零，則爲掉線。但是，在長連接下，有可能很長一段時間都沒有數據往來。理論上說，這個連接是一直保持連接的，但是實際情況中，如果中間節點出現什麼故障是難以知道的。更要命的是，有的節點（防火牆）會自動把一定時間之內沒有數據交互的連接給斷掉。在這個時候，就需要我們的心跳包了，用於維持長連接，保活。

在獲知了斷線之後，服務器邏輯可能需要做一些事情，比如斷線後的數據清理呀，重新連接呀……當然，這個自然是要由邏輯層根據需求去做了。

總的來說，心跳包主要也就是用於長連接的保活和斷線處理。一般的應用下，判定時間在30-40秒比較不錯。如果實在要求高，那就在6-9秒。

TCP協議的KeepAlive機制

學過TCP/IP的同學應該都知道，傳輸層的兩個主要協議是UDP和TCP，其中UDP是無連接的、面向packet的，而TCP協議是有連接、面向流的協議。

所以非常容易理解，使用UDP協議的客戶端（例如早期的“OICQ”，聽說OICQ.com這兩天被搶注了來着，好古老的回憶）需要定時向服務器發送心跳包，告訴服務器自己在線。

然而，MSN和現在的QQ往往使用的是TCP連接了，儘管TCP/IP底層提供了可選的KeepAlive（ACK-ACK包）機制，但是它們也還是實現了更高層的心跳包。似乎既浪費流量又浪費CPU，有點莫名其妙。

具體查了下，TCP的KeepAlive機制是這樣的，首先它貌似默認是不打開的，要用setsockopt將SOL_SOCKET.SO_KEEPALIVE設置爲1纔是打開，並且可以設置三個參數tcp_keepalive_time/tcp_keepalive_probes/tcp_keepalive_intvl，分別表示連接閒置多久開始發keepalive的ack包、發幾個ack包不回覆才當對方死了、兩個ack包之間間隔多長，在我測試的Ubuntu Server 10.04下面默認值是7200秒（2個小時，要不要這麼蛋疼啊！）、9次、75秒。於是連接就了有一個超時時間窗口，如果連接之間沒有通信，這個時間窗口會逐漸減小，當它減小到零的時候，TCP協議會向對方發一個帶有ACK標誌的空數據包（KeepAlive探針），對方在收到ACK包以後，如果連接一切正常，應該回復一個ACK；如果連接出現錯誤了（例如對方重啓了，連接狀態丟失），則應當回覆一個RST；如果對方沒有回覆，服務器每隔intvl的時間再發ACK，如果連續probes個包都被無視了，說明連接被斷開了。

這裏有一篇非常詳細的介紹文章： http://tldp.org/HOWTO/html_single/TCP-Keepalive-HOWTO ，包括了KeepAlive的介紹、相關內核參數、C編程接口、如何爲現有應用（可以或者不可以修改源碼的）啓用KeepAlive機制，很值得詳讀。

這篇文章的2.4節說的是“Preventing disconnection due to network inactivity”，阻止因網絡連接不活躍（長時間沒有數據包）而導致的連接中斷，說的是，很多網絡設備，尤其是NAT路由器，由於其硬件的限制（例如內存、CPU處理能力），無法保持其上的所有連接，因此在必要的時候，會在連接池中選擇一些不活躍的連接踢掉。典型做法是LRU，把最久沒有數據的連接給T掉。通過使用TCP的KeepAlive機制（修改那個time參數），可以讓連接每隔一小段時間就產生一些ack包，以降低被T掉的風險，當然，這樣的代價是額外的網絡和CPU負擔。

前面說到，許多IM協議實現了自己的心跳機制，而不是直接依賴於底層的機制，不知道真正的原因是什麼。

就我看來，一些簡單的協議，直接使用底層機制就可以了，對上層完全透明，降低了開發難度，不用管理連接對應的狀態。而那些自己實現心跳機制的協議，應該是期望通過發送心跳包的同時來傳輸一些數據，這樣服務端可以獲知更多的狀態。例如某些客戶端很喜歡收集用戶的信息……反正是要發個包，不如再塞點數據，否則包頭又浪費了……

大概就是這樣吧。

15.TCP長連接與短連接、心跳機制

杭州的 IT 崩盤了麼？

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

步步學GDB-《2》

14.system/WIFEXITED/WEXITSTATUS函數-linux

17.arm架構的異常與中斷

10.MQTT源碼交叉編譯與移植

2.步步學GDB-基本命令

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結