linux中select()函數分析

本文轉自:《linux中select()函數分析》


Select在Socket編程中還是比較重要的,可是對於初學Socket的人來說都不太愛用Select寫程序,他們只是習慣寫諸如connect、accept、recv或recvfrom這樣的阻塞程序(所謂阻塞方式block,顧名思義,就是進程或是線程執行到這些函數時必須等待某個事件的發生,如果事件沒有發生,進程或線程就被阻塞,函數不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non-block,就是進程或線程執行此函數時不必非要等待事件的發生,一旦執行肯定返回,以返回值的不同來反映函數的執行情況,如果事件發生則與阻塞方式相同,若事件沒有發生則返回一個代碼來告知事件未發生,而進程或線程繼續執行,所以效率較高)方式工作的程序,它能夠監視我們需要監視的文件描述符的變化情況——讀寫或是異常。下面詳細介紹一下! 

Select的函數格式(我所說的是Unix系統下的伯克利socket編程,和windows下的有區別,一會兒說明): 

int select(int maxfdp, fd_set *readfds, fd_set *writefds, fd_set *errorfds, struct timeval *timeout); 

先說明兩個結構體: 

第一,struct fd_set可以理解爲一個集合,這個集合中存放的是文件描述符(file descriptor),即文件句柄,這可以是我們所說的普通意義的文件,當然Unix下任何設備、管道、FIFO等都是文件形式,全部包括在內,所以毫無疑問一個socket就是一個文件,socket句柄就是一個文件描述符。fd_set集合可以通過一些宏由人爲來操作,比如清空集合FD_ZERO(fd_set *),將一個給定的文件描述符加入集合之中FD_SET(int ,fd_set *),將一個給定的文件描述符從集合中刪除FD_CLR(int ,fd_set*),檢查集合中指定的文件描述符是否可以讀寫FD_ISSET(int ,fd_set* )。一會兒舉例說明。 

第二,struct timeval是一個大家常用的結構,用來代表時間值,有兩個成員,一個是秒數,另一個是毫秒數。 

具體解釋select的參數: 

int maxfdp是一個整數值,是指集合中所有文件描述符的範圍,即所有文件描述符的最大值加1,不能錯!在Windows中這個參數的值無所謂,可以設置不正確。 

fd_set *readfds是指向fd_set結構的指針,這個集合中應該包括文件描述符,我們是要監視這些文件描述符的讀變化的,即我們關心是否可以從這些文件中讀取數據了,如果這個集合中有一個文件可讀,select就會返回一個大於0的值,表示有文件可讀,如果沒有可讀的文件,則根據timeout參數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何文件的讀變化。 

fd_set *writefds是指向fd_set結構的指針,這個集合中應該包括文件描述符,我們是要監視這些文件描述符的寫變化的,即我們關心是否可以向這些文件中寫入數據了,如果這個集合中有一個文件可寫,select就會返回一個大於0的值,表示有文件可寫,如果沒有可寫的文件,則根據timeout參數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何文件的寫變化。 

fd_set *errorfds同上面兩個參數的意圖,用來監視文件錯誤異常。 

struct timeval* timeout是select的超時時間,這個參數至關重要,它可以使select處於三種狀態,第一,若將NULL以形參傳入,即不傳入時間結構,就是將select置於阻塞狀態,一定等到監視文件描述符集合中某個文件描述符發生變化爲止;第二,若將時間值設爲0秒0毫秒,就變成一個純粹的非阻塞函數,不管文件描述符是否有變化,都立刻返回繼續執行,文件無變化返回0,有變化返回一個正值;第三,timeout的值大於0,這就是等待的超時時間,即select在timeout時間內阻塞,超時時間之內有事件到來就返回了,否則在超時後不管怎樣一定返回,返回值同上述。 

返回值: 

負值:select錯誤

正值:某些文件可讀寫或出錯

0:等待超時,沒有可讀寫或錯誤的文件

在有了select後可以寫出像樣的網絡程序來!舉個簡單的例子,就是從網絡上接受數據寫入一個文件中。 

例子: 

main() 



int sock; 

FILE *fp; 

struct fd_set fds; 

struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0 

char buffer[256]={0}; //256字節的接收緩衝區 

/* 假定已經建立UDP連接,具體過程不寫,簡單,當然TCP也同理,主機ip和port都已經給定,要寫的文件已經打開

sock=socket(...); 

bind(...); 

fp=fopen(...); */ 

while(1) 



FD_ZERO(&fds); //每次循環都要清空集合,否則不能檢測描述符變化 

FD_SET(sock,&fds); //添加描述符 

FD_SET(fp,&fds); //同上 

maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1 

switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用 



case -1: exit(-1);break; //select錯誤,退出程序 

case 0:break; //再次輪詢 

default: 

if(FD_ISSET(sock,&fds)) //測試sock是否可讀,即是否網絡上有數據 



recvfrom(sock,buffer,256,.....);//接受網絡數據 

if(FD_ISSET(fp,&fds)) //測試文件是否可寫 

fwrite(fp,buffer...);//寫入文件 

buffer清空; 

}// end if break; 

}// end switch 

}//end while 

}//end main
參考資料:http://cuijinbird.blogchina.com/cuijinbird/1921117.html 

Part 2:

select()的機制中提供一fd_set的數據結構,實際上是一long類型的數組, 
每一個數組元素都能與一打開的文件句柄(不管是Socket句柄,還是其他 
文件或命名管道或設備句柄)建立聯繫,建立聯繫的工作由程序員完成, 
當調用select()時,由內核根據IO狀態修改fd_set的內容,由此來通知執 
行了select()的進程哪一Socket或文件可讀,下面具體解釋: 

#include <sys/types.h> 
#include <sys/times.h> 
#include <sys/select.h> 

int select(nfds, readfds, writefds, exceptfds, timeout) 
int nfds; 
fd_set *readfds, *writefds, *exceptfds; 
struct timeval *timeout; 

ndfs:select監視的文件句柄數,視進程中打開的文件數而定,一般設爲呢要監視各文件 
中的最大文件號加一。 
readfds:select監視的可讀文件句柄集合。 
writefds: select監視的可寫文件句柄集合。 
exceptfds:select監視的異常文件句柄集合。 
timeout:本次select()的超時結束時間。(見/usr/sys/select.h, 
可精確至百萬分之一秒!) 

當readfds或writefds中映象的文件可讀或可寫或超時,本次select() 
就結束返回。程序員利用一組系統提供的宏在select()結束時便可判 
斷哪一文件可讀或可寫。對Socket編程特別有用的就是readfds。 
幾隻相關的宏解釋如下: 

FD_ZERO(fd_set *fdset):清空fdset與所有文件句柄的聯繫。 
FD_SET(int fd, fd_set *fdset):建立文件句柄fd與fdset的聯繫。 
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd與fdset的聯繫。 
FD_ISSET(int fd, fdset *fdset):檢查fdset聯繫的文件句柄fd是否 
可讀寫,>0表示可讀寫。 
(關於fd_set及相關宏的定義見/usr/include/sys/types.h) 

這樣,你的socket只需在有東東讀的時候纔讀入,大致如下: 

... 
int sockfd; 
fd_set fdR; 
struct timeval timeout = ..; 
... 
for(;;) { 
FD_ZERO(&fdR); 
FD_SET(sockfd, &fdR); 
switch (select(sockfd + 1, &fdR, NULL, &timeout)) { 
case -1: 
error handled by u; 
case 0: 
timeout hanled by u; 
default: 
if (FD_ISSET(sockfd)) { 
now u read or recv something; 
/* if sockfd is father and 
server socket, u can now 
accept() */ 




所以一個FD_ISSET(sockfd)就相當通知了sockfd可讀。 
至於struct timeval在此的功能,請man select。不同的timeval設置 
使使select()表現出超時結束、無超時阻塞和輪詢三種特性。由於 
timeval可精確至百萬分之一秒,所以Windows的SetTimer()根本不算 
什麼。你可以用select()做一個超級時鐘。 

FD_ACCEPT的實現?依然如上,因爲客戶方socket請求連接時,會發送 
連接請求報文,此時select()當然會結束,FD_ISSET(sockfd)當然大 
於零,因爲有報文可讀嘛!至於這方面的應用,主要在於服務方的父 
Socket,你若不喜歡主動accept(),可改爲如上機制來accept()。 

至於FD_CLOSE的實現及處理,頗費了一堆cpu處理時間,未完待續。 

-- 
討論關於利用select()檢測對方Socket關閉的問題: 

仍然是本地Socket有東東可讀,因爲對方Socket關閉時,會發一個關閉連接 
通知報文,會馬上被select()檢測到的。關於TCP的連接(三次握手)和關 
閉(二次握手)機制,敬請參考有關TCP/IP的書籍。 

不知是什麼原因,UNIX好象沒有提供通知進程關於Socket或Pipe對方關閉的 
信號,也可能是cpu所知有限。總之,當對方關閉,一執行recv()或read(), 
馬上回返回-1,此時全局變量errno的值是115,相應的sys_errlist[errno] 
爲"Connect refused"(請參考/usr/include/sys/errno.h)。所以,在上 
篇的for(;;)...select()程序塊中,當有東西可讀時,一定要檢查recv()或 
read()的返回值,返回-1時要作出關斷本地Socket的處理,否則select()會 
一直認爲有東西讀,其結果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢 
查recv()返回結果,且將收到的東東(實際沒收到)寫至標準輸出... 
在有名管道的編程中也有類似問題出現。具體處理詳見拙作:發佈一個有用 
的Socket客戶方原碼。 

至於主動寫Socket時對方突然關閉的處理則可以簡單地捕捉信號SIGPIPE並作 
出相應關斷本地Socket等等的處理。SIGPIPE的解釋是:寫入無讀者方的管道。 
在此不作贅述,請詳man signal。 

以上是cpu在作tcp/ip數據傳輸實驗積累的經驗,若有錯漏,請狂炮擊之。 

唉,昨天在hacker區被一幫孫子轟得差點兒沒短路。ren cpu(奔騰的心) z80 

補充關於select在異步(非阻塞)connect中的應用,剛開始搞socket編程的時候 
我一直都用阻塞式的connect,非阻塞connect的問題是由於當時搞proxy scan 
而提出的呵呵 
通過在網上與網友們的交流及查找相關FAQ,總算知道了怎麼解決這一問題.同樣 
用select可以很好地解決這一問題.大致過程是這樣的: 

1.將打開的socket設爲非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完 
成(有的系統用FNEDLAY也可). 

2.發connect調用,這時返回-1,但是errno被設爲EINPROGRESS,意即connect仍舊 
在進行還沒有完成. 

3.將打開的socket設進被監視的可寫(注意不是可讀)文件集合用select進行監視, 
如果可寫,用 
getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int)); 
來得到error的值,如果爲零,則connect成功. 

在許多unix版本的proxyscan程序你都可以看到類似的過程,另外在solaris精華 
區->編程技巧中有一個通用的帶超時參數的connect模塊.

 

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1684998

發佈了444 篇原創文章 · 獲贊 141 · 訪問量 132萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章