#ibm-pcon

Linux 套接字編程中的 5 個隱患

在異構環境中開發可靠的網絡應用程序

M. Tim Jones ([email protected]), 資深軟件工程師, Emulex

簡介： Socket API 是網絡應用程序開發中實際應用的標準 API。儘管該 API 簡單，但是開發新手可能會經歷一些常見的問題。本文識別一些最常見的隱患並向您顯示如何避免它們。

發佈日期： 2005 年 10 月 08 日
級別：中級
訪問情況： 10146 次瀏覽
評論： 0 (查看 | 添加評論 - 登錄)

平均分 (29個評分)
爲本文評分

在 4.2 BSD UNIX® 操作系統中首次引入，Sockets API 現在是任何操作系統的標準特性。事實上，很難找到一種不支持 Sockets API 的現代語言。該 API 相當簡單，但新的開發人員仍然會遇到一些常見的隱患。

本文識別那些隱患並向您顯示如何避開它們。

隱患 1．忽略返回狀態

第一個隱患很明顯，但它是開發新手最容易犯的一個錯誤。如果您忽略函數的返回狀態，當它們失敗或部分成功的時候，您也許會迷失。反過來，這可能傳播錯誤，使定位問題的源頭變得困難。

捕獲並檢查每一個返回狀態，而不是忽略它們。考慮清單 1 顯示的例子，一個套接字 send 函數。

清單 1. 忽略 API 函數返回狀態

int status, sock, mode;
/* Create a new stream (TCP) socket */
sock = socket( AF_INET, SOCK_STREAM, 0 );
...
status = send( sock, buffer, buflen, MSG_DONTWAIT );
if (status == -1) {
  /* send failed */
  printf( "send failed: %s\n", strerror(errno) );
} else {
  /* send succeeded -- or did it? */
}

清單 1 探究一個函數片斷，它完成套接字 send 操作（通過套接字發送數據）。函數的錯誤狀態被捕獲並測試，但這個例子忽略了send 在無阻塞模式（由 MSG_DONTWAIT 標誌啓用）下的一個特性。

send API 函數有三類可能的返回值：

如果數據成功地排到傳輸隊列，則返回 0。
如果排隊失敗，則返回 -1（通過使用 errno 變量可以瞭解失敗的原因）。
如果不是所有的字符都能夠在函數調用時排隊，則最終的返回值是發送的字符數。

由於 send 的 MSG_DONTWAIT 變量的無阻塞性質，函數調用在發送完所有的數據、一些數據或沒有發送任何數據後返回。在這裏忽略返回狀態將導致不完全的發送和隨後的數據丟失。

回頁首

隱患 2．對等套接字閉包

UNIX 有趣的一面是您幾乎可以把任何東西看成是一個文件。文件本身、目錄、管道、設備和套接字都被當作文件。這是新穎的抽象，意味着一整套的 API 可以用在廣泛的設備類型上。

考慮 read API 函數，它從文件讀取一定數量的字節。read 函數返回讀取的字節數（最高爲您指定的最大值）；或者 -1，表示錯誤；或者 0，如果已經到達文件末尾。

如果在一個套接字上完成一個 read 操作並得到一個爲 0 的返回值，這表明遠程套接字端的對等層調用了 close API 方法。該指示與文件讀取相同 —— 沒有多餘的數據可以通過描述符讀取（參見清單 2）。

清單 2．適當處理 read API 函數的返回值

int sock, status;
sock = socket( AF_INET, SOCK_STREAM, 0 );
...
status = read( sock, buffer, buflen );
if (status > 0) {
  /* Data read from the socket */
} else if (status == -1) {
  /* Error, check errno, take action... */
} else if (status == 0) {
  /* Peer closed the socket, finish the close */
  close( sock );
  /* Further processing... */
}

同樣，可以用 write API 函數來探測對等套接字的閉包。在這種情況下，接收 SIGPIPE 信號，或如果該信號阻塞，write 函數將返回 -1 並設置 errno 爲 EPIPE。

回頁首

隱患 3．地址使用錯誤（EADDRINUSE）

您可以使用 bind API 函數來綁定一個地址（一個接口和一個端口）到一個套接字端點。可以在服務器設置中使用這個函數，以便限制可能有連接到來的接口。也可以在客戶端設置中使用這個函數，以便限制應當供出去的連接所使用的接口。bind 最常見的用法是關聯端口號和服務器，並使用通配符地址（INADDR_ANY），它允許任何接口爲到來的連接所使用。

bind 普遍遭遇的問題是試圖綁定一個已經在使用的端口。該陷阱是也許沒有活動的套接字存在，但仍然禁止綁定端口（bind 返回EADDRINUSE），它由 TCP 套接字狀態 TIME_WAIT 引起。該狀態在套接字關閉後約保留 2 到 4 分鐘。在 TIME_WAIT 狀態退出之後，套接字被刪除，該地址才能被重新綁定而不出問題。

等待 TIME_WAIT 結束可能是令人惱火的一件事，特別是如果您正在開發一個套接字服務器，就需要停止服務器來做一些改動，然後重啓。幸運的是，有方法可以避開 TIME_WAIT 狀態。可以給套接字應用 SO_REUSEADDR 套接字選項，以便端口可以馬上重用。

考慮清單 3 的例子。在綁定地址之前，我以 SO_REUSEADDR 選項調用 setsockopt。爲了允許地址重用，我設置整型參數（on）爲 1 （不然，可以設爲 0 來禁止地址重用）。

清單 3．使用 SO_REUSEADDR 套接字選項避免地址使用錯誤

int sock, ret, on;
struct sockaddr_in servaddr;
/* Create a new stream (TCP) socket */
sock = socket( AF_INET, SOCK_STREAM, 0 ):
/* Enable address reuse */
on = 1;
ret = setsockopt( sock, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on) );
/* Allow connections to port 8080 from any available interface */
memset( &servaddr, 0, sizeof(servaddr) );
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl( INADDR_ANY );
servaddr.sin_port = htons( 45000 );
/* Bind to the address (interface/port) */
ret = bind( sock, (struct sockaddr *)&servaddr, sizeof(servaddr) );

在應用了 SO_REUSEADDR 選項之後，bind API 函數將允許地址的立即重用。

回頁首

隱患 4．發送結構化數據

套接字是發送無結構二進制字節流或 ASCII 數據流（比如 HTTP 上的 HTTP 頁面，或 SMTP 上的電子郵件）的完美工具。但是如果試圖在一個套接字上發送二進制數據，事情將會變得更加複雜。

比如說，您想要發送一個整數：您可以肯定，接收者將使用同樣的方式來解釋該整數嗎？運行在同一架構上的應用程序可以依賴它們共同的平臺來對該類型的數據做出相同的解釋。但是，如果一個運行在高位優先的 IBM PowerPC 上的客戶端發送一個 32 位的整數到一個低位優先的 Intel x86，那將會發生什麼呢？字節排列將引起不正確的解釋。

字節交換還是不呢？

Endianness 是指內存中字節的排列順序。高位優先（big endian） 按最高有效字節在前排列，然而 低位優先（little endian） 按照最低有效字節在前排序。

高位優先架構（比如 PowerPC®）比低位優先架構（比如 Intel® Pentium® 系列，其網絡字節順序是高位優先）有優勢。這意味着，對高位優先的機器來說，在 TCP/IP 內控制數據是自然有序的。低位優先架構要求字節交換 —— 對網絡應用程序來說，這是一個輕微的性能弱點。

通過套接字發送一個 C 結構會怎麼樣呢？這裏，也會遇到麻煩，因爲不是所有的編譯器都以相同的方式排列一個結構的元素。結構也可能被壓縮以便使浪費的空間最少，這進一步使結構中的元素錯位。

幸好，有解決這個問題的方案，能夠保證兩端數據的一致解釋。過去，遠程過程調用（Remote Procedure Call，RPC）套裝工具提供所謂的外部數據表示（External Data Representation，XDR）。XDR 爲數據定義一個標準的表示來支持異構網絡應用程序通信的開發。

現在，有兩個新的協議提供相似的功能。可擴展標記語言/遠程過程調用（XML/RPC）以 XML 格式安排 HTTP 上的過程調用。數據和元數據用 XML 進行編碼並作爲字符串傳輸，並通過主機架構把值和它們的物理表示分開。SOAP 跟隨 XML-RPC，以更好的特性和功能擴展了它的思想。參見參考資料小節，獲取更多關於每個協議的信息。

回頁首

隱患 5．TCP 中的幀同步假定

TCP 不提供幀同步，這使得它對於面向字節流的協議是完美的。這是 TCP 與 UDP（User Datagram Protocol，用戶數據報協議）的一個重要區別。UDP 是面向消息的協議，它保留髮送者和接收者之間的消息邊界。TCP 是一個面向流的協議，它假定正在通信的數據是無結構的，如圖 1 所示。

圖 1．UDP 的幀同步能力和缺乏幀同步的 TCP

圖 1 的上部說明一個 UDP 客戶端和服務器。左邊的對等層完成兩個套接字的寫操作，每個 100 字節。協議棧的 UDP 層追蹤寫的數量，並確保當右邊的接收者通過套接字獲取數據時，它以同樣數量的字節到達。換句話說，爲讀者保留了寫者提供的消息邊界。

現在，看圖 1 的底部．它爲 TCP 層演示了相同粒度的寫操作。兩個獨立的寫操作（每個 100 字節）寫入流套接字。但在本例中，流套接字的讀者得到的是 200 字節。協議棧的 TCP 層聚合了兩次寫操作。這種聚合可以發生在 TCP/IP 協議棧的發送者或接收者中任何一方。重要的是，要注意到聚合也許不會發生 —— TCP 只保證數據的有序發送。

對大多數開發人員來說，該陷阱會引起困惑。您想要獲得 TCP 的可靠性和 UDP 的幀同步。除非改用其他的傳輸協議，比如流傳輸控制協議（STCP），否則就要求應用層開發人員來實現緩衝和分段功能。

回頁首

調試套接字應用程序的工具

GNU/Linux 提供幾個工具，它們可以幫助您發現套接字應用程序中的一些問題。此外，使用這些工具還有教育意義，而且能夠幫助解釋應用程序和 TCP/IP 協議棧的行爲。在這裏，您將看到對幾個工具的概述。查閱下面的參考資料瞭解更多的信息。

查看網絡子系統的細節

netstat 工具提供查看 GNU/Linux 網絡子系統的能力。使用 netstat，可以查看當前活動的連接（按單個協議進行查看），查看特定狀態的連接（比如處於監聽狀態的服務器套接字）和許多其他的信息。清單 4 顯示了 netstat 提供的一些選項和它們啓用的特性。

清單 4．netstat 實用程序的用法模式

View all TCP sockets currently active
$ netstat --tcp
View all UDP sockets
$ netstat --udp
View all TCP sockets in the listening state
$ netstat --listening
View the multicast group membership information
$ netstat --groups
Display the list of masqueraded connections
$ netstat --masquerade
View statistics for each protocol
$ netstat --statistics

儘管存在許多其他的實用程序，但 netstat 的功能很全面，它覆蓋了 route、ifconfig 和其他標準 GNU/Linux 工具的功能。

監視流量

可以使用 GNU/Linux 的幾個工具來檢查網絡上的低層流量。tcpdump 工具是一個比較老的工具，它從網上“嗅探”網絡數據包，打印到stdout 或記錄在一個文件中。該功能允許查看應用程序產生的流量和 TCP 生成的低層流控制機制。一個叫做 tcpflow 的新工具與tcpdump 相輔相成，它提供協議流分析和適當地重構數據流的方法，而不管數據包的順序或重發。清單 5 顯示 tcpdump 的兩個用法模式。

清單 5．tcpdump 工具的用法模式

Display all traffic on the eth0 interface for the local host
$ tcpdump -l -i eth0
Show all traffic on the network coming from or going to host plato
$ tcpdump host plato
Show all HTTP traffic for host camus
$ tcpdump host camus and (port http)
View traffic coming from or going to TCP port 45000 on the local host
$ tcpdump tcp port 45000

tcpdump 和 tcpflow 工具有大量的選項，包括創建複雜過濾表達式的能力。查閱下面的參考資料獲取更多關於這些工具的信息。

tcpdump 和 tcpflow 都是基於文本的命令行工具。如果您更喜歡圖形用戶界面（GUI），有一個開放源碼工具 Ethereal 也許適合您的需要。Ethereal 是一個專業的協議分析軟件，它可以幫助調試應用層協議。它的插入式架構（plug-in architecture）可以分解協議，比如 HTTP 和您能想到的任何協議（寫本文的時候共有 637 個協議）。

回頁首

總結

套接字編程是容易而有趣的，但是您要避免引入錯誤或至少使它們容易被發現，這就需要考慮本文中描述的這 5 個常見的陷阱，並且採用標準的防錯性程序設計實踐。GNU/Linux 工具和實用程序還可以幫助發現一些程序中的小問題。記住：在查看實用程序的幫助手冊時候，跟蹤相關的或“請參見”工具。您也許會發現一個必要的新工具。

參考資料

學習

您可以參閱本文在 developerWorks 全球站點上的英文原文。
TCP 狀態機有 11 個狀態。參見 W. Richard Steven 的 illustration from TCP/IP Illustrated, Volume 1 一書。
在 Wikipedia 上探究 Endianness 的歷史和含意。
瞭解更多關於 IBM 的開放式、可伸縮和可定製的 Power Architecture 的信息。
從 Programming in C 課件閱讀 RPC/XDR 簡介。
獲取更多關於 XML-RPC 以及在 Java™ 應用程序中如何使用它的信息，請閱讀 “Java 編程中的 XML-RPC” （developerWorks，2004 年 1 月）。
SOAP 以 XML-RPC 的特性爲基礎。請在 SoapWare.Org 上查找規範、工具、教程和文章。
SCTP 兼有 TCP 和 UDP 的特性，以及可用性和可靠性。
教程 “Linux Socket 編程，第一部分” （developerWorks，2003 年 10 月）講解如何開始套接字編程以及如何構建一個通過 TCP/IP 連接的 echo 服務器和客戶端。“Linux Socket 編程，第二部分” （developerWorks，2004 年 1 月）集中討論 UDP 並且講解如何用 C 和 Python 編寫 UDP 套接字應用程序（儘管代碼會翻譯爲其他語言）。
netstat 手冊頁提供有關各種使用 netstat 的方法的細節。
BSD Sockets Programming from a Multilanguage Perspective （作者 M. Tim Jones），用 6 種不同的語言介紹了套接字編程的技巧。
在 developerWorks Linux 專區上查找更多爲 Linux 開發人員提供的參考資料。

獲得產品和技術

tcpdump 和 tcpflow 實用程序可以用來監控網絡流量。
Ethereal network protocol analyzer 提供 tcpdump 的功能，它具有圖形用戶界面和可伸縮的插入式架構。
免費索取 SEK for Linux（兩張 DVD），它包含來自 DB2®、Lotus®、Rational®、Tivoli® 以及 WebSphere® 的最新 IBM 試用軟件的 Linux 版本。
用 IBM 試用軟件在 Linux 上構建您的下一個開發項目，可以直接在 developerWorks 上下載。

Linux 套接字編程中的 5 個隱患

轉自：https://www.ibm.com/developerworks/cn/linux/l-sockpit/#ibm-pcon

Linux 套接字編程中的 5 個隱患

字節交換還是不呢？

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

mutex spinlock

Minix系統inode管理

Q&A With Nine Great Programmers

進程同步 & 互斥

Minix 文件信息及其數據的定位

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結