問題背景:
最近做C/S結構的程序,項目中需要開發TCP服務器端,需要能夠接收多個客戶端的連接請求。開發完成後,測試過程中出現瞭如題問題。
問題描述:
啓動服務器,開啓多個客戶端,建立連接通訊,一切正常。關閉客戶端(一個或多個),此時用netstat命令查看網絡狀態,發現所關閉的客戶端的連接沒有完全釋放,而是處於CLOSE_WAIT狀態。
解決方法:
MSDN中獲取當前的連接狀態的說明如下:
Connected 屬性的值反映最近操作時的連接狀態。如果您需要確定連接的當前狀態,請進行非阻止、零字節的 Send 調用。如果該調用成功返回或引發 WAEWOULDBLOCK 錯誤代碼 (10035),則該套接字仍然處於連接狀態;否則,該套接字不再處於連接狀態。
經測試測方法並不能準確的獲取到當前連接的狀態。(環境:windows xp sp3,.Net framework 3.5)。測試發現每次關閉客戶端後異步接受的返回值都零字節(我使用的是異步接收數據),因此就依據這一條件判斷連接是否斷開,即接收的字節爲零則斷開連接。經過測試此種方式確實可以對客戶程序的退出作出及時的響應,本以爲問題到此已經解決了,但是對另一種客戶端斷開方式——網線斷開,還是不能及時地作出響應。搜索相關問題,找到參考文章(http://tech.it168.com/msoft/2008-01-31/200801311356430.shtml)。,有如下描述:
【引用參考】我們知道,TCP有一個連接檢測機制,就是如果在指定的時間內(一般爲2個小時)沒有數據傳送,會給對端發送一個Keep-Alive數據報,使用的序列號是曾經發出的最後一個報文的最後一個字節的序列號,對端如果收到這個數據,回送一個TCP的ACK,確認這個字節已經收到,這樣就知道此連接沒有被斷開。如果一段時間沒有收到對方的響應,會進行重試,重試幾次後,向對端發一個reset,然後將連接斷掉。
在Windows中,第一次探測是在最後一次數據發送的兩個小時,然後每隔1秒探測一次,一共探測5次,如果5次都沒有收到迴應的話,就會斷開這個連接。但兩個小時對於我們的項目來說顯然太長了。我們必須縮短這個時間。那麼我們該如何做呢?我要利用Socket類的IOControl()函數。我們來看看這個函數能幹些什麼:
使用 IOControlCode 枚舉指定控制代碼,爲 Socket 設置低級操作模式。 【引用參考】
MSDN中IOControlCode的說明:爲 Socket 設置低級別操作模式。兩個重載如下:
1、IOControl(Int32, array<Byte>[]()[], array<Byte>[]()[])
2、IOControl(IOControlCode, array<Byte>[]()[], array<Byte>[]()[])
我們採用第二種重載。
首先需要弄清參數的意義。
【引用參考】
在C++裏它是一個結構體。我們來看看這個結構體:
struct tcp_keepalive
{
u_long onoff; //是否啓用Keep-Alive
u_long keepalivetime; //多長時間後開始第一次探測(單位:毫秒)
u_long keepaliveinterval; //探測時間間隔(單位:毫秒)
};
在C#中,我們直接用一個Byte數組傳遞給函數:
uint dummy = 0;
byte[] inOptionValues = new byte[Marshal.SizeOf(dummy) * 3];
BitConverter.GetBytes((uint)1).CopyTo(inOptionValues, 0);//是否啓用Keep-Alive
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy));//多長時間開始第一次探測
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy) * 2);//探測時間間隔
【引用參考】
結合以上兩種種方法,服務器端對網絡連接的斷開都能作出及時的響應,至此問題解決。
如果其中有描述不清楚或不正確的地方,望不吝賜教。
參考:
1、http://tech.it168.com/msoft/2008-01-31/200801311356430.shtml