socket緩衝區
每個 socket 被創建後,都會分配兩個緩衝區,輸入緩衝區和輸出緩衝區。
write()/send() 並不立即向網絡中傳輸數據,而是先將數據寫入緩衝區中,再由TCP協議將數據從緩衝區發送到目標機器。一旦將數據寫入到緩衝區,函數就可以成功返回,不管它們有沒有到達目標機器,也不管它們何時被髮送到網絡,這些都是TCP協議負責的事情。
TCP協議獨立於 write()/send() 函數,數據有可能剛被寫入緩衝區就發送到網絡,也可能在緩衝區中不斷積壓,多次寫入的數據被一次性發送到網絡,這取決於當時的網絡情況、當前線程是否空閒等諸多因素,不由程序員控制。
read()/recv() 函數也是如此,也從輸入緩衝區中讀取數據,而不是直接從網絡中讀取。
圖:TCP套接字的I/O緩衝區示意圖
這些I/O緩衝區特性可整理如下:
- I/O緩衝區在每個TCP套接字中單獨存在;
- I/O緩衝區在創建套接字時自動生成;
- 即使關閉套接字也會繼續傳送輸出緩衝區中遺留的數據;
- 關閉套接字將丟失輸入緩衝區中的數據。
輸入輸出緩衝區的默認大小一般都是 8K,可以通過 getsockopt() 函數獲取:
- unsigned optVal;
- int optLen = sizeof(int);
- getsockopt(servSock, SOL_SOCKET, SO_SNDBUF, (char*)&optVal, &optLen);
- printf("Buffer length: %d\n", optVal);
運行結果:
Buffer length: 8192
這裏僅給出示例,後面會詳細講解。
阻塞模式
對於TCP套接字(默認情況下),當使用 write()/send() 發送數據時:
1) 首先會檢查緩衝區,如果緩衝區的可用空間長度小於要發送的數據,那麼 write()/send() 會被阻塞(暫停執行),直到緩衝區中的數據被髮送到目標機器,騰出足夠的空間,才喚醒 write()/send() 函數繼續寫入數據。
2) 如果TCP協議正在向網絡發送數據,那麼輸出緩衝區會被鎖定,不允許寫入,write()/send() 也會被阻塞,直到數據發送完畢緩衝區解鎖,write()/send() 纔會被喚醒。
3) 如果要寫入的數據大於緩衝區的最大長度,那麼將分批寫入。
4) 直到所有數據被寫入緩衝區 write()/send() 才能返回。
當使用 read()/recv() 讀取數據時:
1) 首先會檢查緩衝區,如果緩衝區中有數據,那麼就讀取,否則函數會被阻塞,直到網絡上有數據到來。
2) 如果要讀取的數據長度小於緩衝區中的數據長度,那麼就不能一次性將緩衝區中的所有數據讀出,剩餘數據將不斷積壓,直到有 read()/recv() 函數再次讀取。
3) 直到讀取到數據後 read()/recv() 函數纔會返回,否則就一直被阻塞。
這就是TCP套接字的阻塞模式。所謂阻塞,就是上一步動作沒有完成,下一步動作將暫停,直到上一步動作完成後才能繼續,以保持同步性。
TCP套接字默認情況下是阻塞模式,也是最常用的。當然你也可以更改爲非阻塞模式