Linux下socket緩衝區及阻塞模式

socket緩衝區

每個 socket 被創建後,都會分配兩個緩衝區,輸入緩衝區和輸出緩衝區。
write()/send() 並不立即向網絡中傳輸數據,而是先將數據寫入緩衝區中,再由TCP協議將數據從緩衝區發送到目標機器。一旦將數據寫入到緩衝區,函數就可以成功返回,不管它們有沒有到達目標機器,也不管它們何時被髮送到網絡,這些都是TCP協議負責的事情。
TCP協議獨立於 write()/send() 函數,數據有可能剛被寫入緩衝區就發送到網絡,也可能在緩衝區中不斷積壓,多次寫入的數據被一次性發送到網絡,這取決於當時的網絡情況、當前線程是否空閒等諸多因素,不由程序員控制。

  • I/O緩衝區在每個TCP套接字中單獨存在;
  • I/O緩衝區在創建套接字時自動生成;
  • 即使關閉套接字也會繼續傳送輸出緩衝區中遺留的數據;
  • 關閉套接字將丟失輸入緩衝區中的數據

輸入輸出緩衝區的默認大小一般都是 8K,可以通過 getsockopt() 函數獲取:1024x8=8192

unsigned optVal;
int optLen = sizeof(int);
getsockopt(servSock, SOL_SOCKET, SO_SNDBUF, (char*)&optVal, &optLen);
printf("Buffer length: %d\n", optVal);

socket(AF_INET, SOCK_STREAM, 0);
每個TCP Socket在內核中都有一個發送緩衝區和一個接收緩衝區, TCP的全雙工工作模式以及TCP的滑動窗口就是依賴這兩個獨立的buffer以及buffer的填充狀態。

應用程序調用write()或send()時,僅僅是把應用程序buffer中的數據copy到socket的發送緩衝區中(write()或send()返回時,data並不一定已經發送到對端了),在適當的時機,內核會把socket發送緩衝區的數據發送到接收方的socket接受緩衝區

接收方的應用程序調用read()或receve()時,僅僅是從接收方的socket接受緩衝區中把數據copy到應用程序的buffer中。如果應用程序一直沒有調用read()讀取的話,此數據會一直緩存在相應的socket的接收緩衝區。

如果發送端特別快的時候,緩衝區很快就被填滿(socket默認的是1024×8=8192字節),這時候我們應該根據情況設置緩衝區的大小,可以通過setsockopt函數實現。通過getsockopt函數查看緩衝區的大小。

getsockopt(s, SOL_SOCKET, SO_RCVBUF, &rcv_size, &optlen);
setsockopt(s,SOL_SOCKET,SO_RCVBUF, (char *)&rcv_size, optlen);
 

UDP的接收緩衝區:
每個UDP Socket都有一個接收緩衝區,沒有發送緩衝區。有數據就直接發送,不管對方是否能夠正確接收,也不管對端接收緩衝區是否已經滿了。
UDP是沒有流量控制的;快的發送者可以很容易地就淹沒慢的接收者,導致接收方的UDP丟棄數據報

阻塞模式

對於TCP套接字(默認情況下),當使用 write()/send() 發送數據時:
1) 首先會檢查緩衝區,如果緩衝區的可用空間長度小於要發送的數據,那麼 write()/send() 會被阻塞(暫停執行),直到緩衝區中的數據被髮送到目標機器,騰出足夠的空間,才喚醒 write()/send() 函數繼續寫入數據。
2) 如果TCP協議正在向網絡發送數據,那麼輸出緩衝區會被鎖定,不允許寫入,write()/send() 也會被阻塞,直到數據發送完畢緩衝區解鎖,write()/send() 纔會被喚醒。
3) 如果要寫入的數據大於緩衝區的最大長度,那麼將分批寫入。
4) 直到所有數據被寫入緩衝區 write()/send() 才能返回。

當使用 read()/recv() 讀取數據時:
1) 首先會檢查緩衝區,如果緩衝區中有數據,那麼就讀取,否則函數會被阻塞,直到網絡上有數據到來。
2) 如果要讀取的數據長度小於緩衝區中的數據長度,那麼就不能一次性將緩衝區中的所有數據讀出,剩餘數據將不斷積壓,直到有 read()/recv() 函數再次讀取。
3) 直到讀取到數據後 read()/recv() 函數纔會返回,否則就一直被阻塞。
這就是TCP套接字的阻塞模式。所謂阻塞,就是上一步動作沒有完成,下一步動作將暫停,直到上一步動作完成後才能繼續,以保持同步性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章