Linux poll機制分析

【轉載】:http://www.blogjava.net/ThinkingTalking/archive/2010/07/08/325523.html


所有的系統調用,基於都可以在它的名字前加上“sys_”前綴,這就是它在內核中對應的函數。比如系統調用openreadwritepoll,與之對應的內核函數爲:sys_opensys_readsys_writesys_poll

一、內核框架:
對於系統調用pollselect,它們對應的內核函數都是sys_poll。分析sys_poll,即可理解poll機制。
1.
sys_poll
函數位於fs/select.c文件中,代碼如下:
asmlinkage long sys_poll(struct pollfd __user *ufds, unsigned int nfds,

long timeout_msecs)

{

s64 timeout_jiffies;



if (timeout_msecs > 0) {

#if HZ > 1000

/* We can only overflow if HZ > 1000 */


if (timeout_msecs / 1000 > (s64)0x7fffffffffffffffULL / (s64)HZ)


timeout_jiffies = -1;


else

#endif

timeout_jiffies = msecs_to_jiffies(timeout_msecs);


} else {


/* Infinite (< 0) or no (0) timeout */


timeout_jiffies = timeout_msecs;


}



return do_sys_poll(ufds, nfds, &timeout_jiffies);

}
它對超時參數稍作處理後,直接調用do_sys_poll

2.
do_sys_poll
函數也位於位於fs/select.c文件中,我們忽略其他代碼:
int do_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)
{
……
poll_initwait(&table);
……

fdcount = do_poll(nfds, head, &table, timeout);

……
}

poll_initwait函數非常簡單,它初始化一個poll_wqueues變量table
poll_initwait > init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;
table->pt->qproc = __pollwait__pollwait將在驅動的poll函數裏用到。


3.
do_sys_poll
函數位於fs/select.c文件中,代碼如下:

static int do_poll(unsigned int nfds,
struct poll_list *list,



struct poll_wqueues *wait, s64 *timeout)

{
01 ……
02
for (;;) {

03 ……
04
if (do_pollfd(pfd, pt)) {

05
count++;

06
pt = NULL;

07
}

08 ……
09
if (count || !*timeout || signal_pending(current))

10
break;

11
count = wait->error;

12
if (count)

13
break;

14
15
if (*timeout < 0) {

16
/* Wait indefinitely */

17
__timeout = MAX_SCHEDULE_TIMEOUT;

18
} else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {

19
/*

20
* Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in

21
* a loop

22
*/

23
__timeout = MAX_SCHEDULE_TIMEOUT - 1;

24
*timeout -= __timeout;

25
} else {

26
__timeout = *timeout;

27
*timeout = 0;

28
}

29
30
__timeout = schedule_timeout(__timeout);

31
if (*timeout >= 0)

32
*timeout += __timeout;

33
}

34
__set_current_state(TASK_RUNNING);

35
return count;

36 }

分析其中的代碼,可以發現,它的作用如下:

02行可以知道,這是個循環,它退出的條件爲:
a.
09
行的3個條件之一(count0,超時、有信號等待處理)
count0表示04行的do_pollfd至少有一個成功。
b.
11
12行:發生錯誤

重點在do_pollfd函數,後面再分析

30行,讓本進程休眠一段時間,注意:應用程序執行poll調用後,如果①②的條件不滿足,進程就會進入休眠。那麼,誰喚醒呢?除了休眠到指定時間被系統喚醒外,還可以被驅動程序喚醒──記住這點,這就是爲什麼驅動的poll裏要調用poll_wait的原因,後面分析。

4.
do_pollfd
函數位於fs/select.c文件中,代碼如下:
static inline unsigned int do_pollfd(struct pollfd *pollfd, poll_table *pwait)
{
……

if (file->f_op && file->f_op->poll)


mask = file->f_op->poll(file, pwait);

……
}

可見,它就是調用我們的驅動程序裏註冊的poll函數。

二、驅動程序:
驅動程序裏與
poll相關的地方有兩處:一是構造file_operation結構時,要定義自己的poll函數。二是通過poll_wait來調用上面說到的__pollwait函數,pollwait的代碼如下:
static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
{

if (p && wait_address)


p->qproc(filp, wait_address, p);

}
p->qproc就是__pollwait函數,從它的代碼可知,它只是把當前進程掛入我們驅動程序裏定義的一個隊列裏而已。它的代碼如下:
static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,

poll_table *p)

{

struct poll_table_entry *entry = poll_get_entry(p);


if (!entry)


return;


get_file(filp);


entry->filp = filp;


entry->wait_address = wait_address;


init_waitqueue_entry(&entry->wait, current);


add_wait_queue(wait_address, &entry->wait);

}

執行到驅動程序的poll_wait函數時,進程並沒有休眠,我們的驅動程序裏實現的poll函數是不會引起休眠的。讓進程進入休眠,是前面分析的do_sys_poll函數的30行“__timeout = schedule_timeout(__timeout)”。
poll_wait只是把本進程掛入某個隊列,應用程序調用poll > sys_poll > do_sys_poll > poll_initwaitdo_poll > do_pollfd > 我們自己寫的poll函數後,再調用schedule_timeout進入休眠。如果我們的驅動程序發現情況就緒,可以把這個隊列上掛着的進程喚醒。可見,poll_wait的作用,只是爲了讓驅動程序能找到要喚醒的進程。即使不用poll_wait,我們的程序也有機會被喚醒:chedule_timeout(__timeout),只是休眠__time_out這段時間。

現在來總結一下poll機制:
1. poll > sys_poll > do_sys_poll > poll_initwaitpoll_initwait函數註冊一下回調函數__pollwait,它就是我們的驅動程序執行poll_wait時,真正被調用的函數。

2. 接下來執行file->f_op->poll,即我們驅動程序裏自己實現的poll函數
它會調用poll_wait把自己掛入某個隊列,這個隊列也是我們的驅動自己定義的;
它還判斷一下設備是否就緒。

3. 如果設備未就緒,do_sys_poll裏會讓進程休眠一定時間

4. 進程被喚醒的條件有2:一是上面說的“一定時間”到了,二是被驅動程序喚醒。驅動程序發現條件就緒時,就把“某個隊列”上掛着的進程喚醒,這個隊列,就是前面通過poll_wait把本進程掛過去的隊列。

5. 如果驅動程序沒有去喚醒進程,那麼chedule_timeout(__timeou)超時後,會重複23動作,直到應用程序的poll調用傳入的時間到達。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章