詳述socket編程之select()和poll()函數

elect()函數和poll()函數均是主要用來處理多路I/O複用的情況。比如一個服務器既想等待輸入終端到來,又想等待若干個套接字有客戶請求到達,這時候就需要藉助select或者poll函數了。

(一)select()函數

原型如下:

1 int select(int fdsp1, fd_set *readfds, fd_set *writefds, fd_set *errorfds, const struct timeval *timeout);

各個參數含義如下:
  • int fdsp1:最大描述符值 + 1
  • fd_set *readfds:對可讀感興趣的描述符集
  • fd_set *writefds:對可寫感興趣的描述符集
  • fd_set *errorfds:對出錯感興趣的描述符集
  • struct timeval *timeout:超時時間(注意:對於linux系統,此參數沒有const限制,每次select調用完畢timeout的值都被修改爲剩餘時間,而unix系統則不會改變timeout值)
select函數會在發生以下情況時返回:
  1. readfds集合中有描述符可讀
  2. writefds集合中有描述符可寫
  3. errorfds集合中有描述符遇到錯誤條件
  4. 指定的超時時間timeout到了
當select返回時,描述符集合將被修改以指示哪些個描述符正處於可讀、可寫或有錯誤狀態。可以用FD_ISSET宏對描述符進行測試以找到狀態變化的描述符。如果select因爲超時而返回的話,所有的描述符集合都將被清空。
select函數返回狀態發生變化的描述符總數。返回0意味着超時。失敗則返回-1並設置errno。可能出現的錯誤有:EBADF(無效描述符)、EINTR(因終端而返回)、EINVAL(nfds或timeout取值錯誤)。
設置描述符集合通常用如下幾個宏定義:

1 FD_ZERO(fd_set *fdset);                /* clear all bits in fdset           */
2 FD_SET(int fd, fd_set *fdset);         /* turn on the bit for fd in fd_set  */
3 FD_CLR(int fd, fd_set *fdset);         /* turn off the bit for fd in fd_set */
4 int FD_ISSET(int fd, fd_set *fdset);   /* is the bit for fd on in fdset?    */

如:

1 fd_set rset;
2 FD_ZERO(&rset);                        /* initialize the set: all bits off  */
3 FD_SET(1&rset);                      /* turn on bit for fd 1              */
4 FD_SET(4&rset);                      /* turn on bit for fd 4              */
5 FD_SET(5&rset);                      /* turn on bit for fd 5              */

當select返回的時候,rset位都將被置0,除了那些有變化的fd位。
當發生如下情況時認爲是可讀的:
  1. socket的receive buffer中的字節數大於socket的receive buffer的low-water mark屬性值。(low-water mark值類似於分水嶺,當receive buffer中的字節數小於low-water mark值的時候,認爲socket還不可讀,只有當receive buffer中的字節數達到一定量的時候才認爲socket可讀)
  2. 連接半關閉(讀關閉,即收到對端發來的FIN包)
  3. 發生變化的描述符是被動套接字,而連接的三路握手完成的數量大於0,即有新的TCP連接建立
  4. 描述符發生錯誤,如果調用read系統調用讀套接字的話會返回-1。
當發生如下情況時認爲是可寫的:
  1. socket的send buffer中的字節數大於socket的send buffer的low-water mark屬性值以及socket已經連接或者不需要連接(如UDP)。
  2. 寫半連接關閉,調用write函數將產生SIGPIPE
  3. 描述符發生錯誤,如果調用write系統調用寫套接字的話會返回-1。
注意:
select默認能處理的描述符數量是有上限的,爲FD_SETSIZE的大小。
對於timeout參數,如果置爲NULL,則表示wait forever;若timeout->tv_sec = timeout->tv_usec = 0,則表示do not wait at all;否則指定等待時間。
如果使用select處理多個套接字,那麼需要使用一個數組(也可以是其他結構)來記錄各個描述符的狀態。而使用poll則不需要,下面看poll函數。

(二)poll()函數

原型如下:

1 int poll(struct pollfd *fdarray, unsigned long nfds, int timeout);

各參數含義如下:
  • struct pollfd *fdarray:一個結構體,用來保存各個描述符的相關狀態。
  • unsigned long nfds:fdarray數組的大小,即裏面包含有效成員的數量。
  • int timeout:設定的超時時間。(以毫秒爲單位)
poll函數返回值及含義如下:
  • -1:有錯誤產生
  • 0:超時時間到,而且沒有描述符有狀態變化
  • >0:有狀態變化的描述符個數
着重講fdarray數組,因爲這是它和select()函數主要的不同的地方:
pollfd的結構如下:

1 struct pollfd {
2    int fd;                  /* descriptor to check */
3    short events;      /* events of interest on fd */
4    short revents;     /* events that occured on fd */
5 };

其實poll()和select()函數要處理的問題是相同的,只不過是不同組織在幾乎相同時刻同時推出的,因此才同時保留了下來。select()函數把可讀描述符、可寫描述符、錯誤描述符分在了三個集合裏,這三個集合都是用bit位來標記一個描述符,一旦有若干個描述符狀態發生變化,那麼它將被置位,而其他沒有發生變化的描述符的bit位將被clear,也就是說select()的readset、writeset、errorset是一個value-result類型,通過它們傳值,而也通過它們返回結果。這樣的一個壞處是每次重新select 的時候對集合必須重新賦值。而poll()函數則與select()採用的方式不同,它通過一個結構數組保存各個描述符的狀態,每個結構體第一項fd代表描述符,第二項代表要監聽的事件,也就是感興趣的事件,而第三項代表poll()返回時描述符的返回狀態。合法狀態如下:

  • POLLIN:                有普通數據或者優先數據可讀
  • POLLRDNORM:    有普通數據可讀
  • POLLRDBAND:    有優先數據可讀
  • POLLPRI:              有緊急數據可讀
  • POLLOUT:            有普通數據可寫
  • POLLWRNORM:   有普通數據可寫
  • POLLWRBAND:    有緊急數據可寫
  • POLLERR:            有錯誤發生
  • POLLHUP:            有描述符掛起事件發生
  • POLLNVAL:          描述符非法

對於POLLIN | POLLPRI等價與select()的可讀事件;POLLOUT | POLLWRBAND等價與select()的可寫事件;POLLIN 等價與POLLRDNORM | POLLRDBAND,而POLLOUT等價於POLLWRBAND。如果你對一個描述符的可讀事件和可寫事件以及錯誤等事件均感興趣那麼你應該都進行相應的設置。
對於timeout的設置如下:
  • INFTIM:   wait forever
  • 0:            return immediately, do not block
  • >0:         wait specified number of milliseconds

對於select()和poll()函數的講解暫時到此。 更多細節請參考下面這篇博文:http://www.cppblog.com/just51living/archive/2011/07/28/151995.html
發佈了7 篇原創文章 · 獲贊 23 · 訪問量 25萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章