might_sleep

might_sleep(): 指示當前函數可以睡眠。如果它所在的函數處於原子上下文(atomic context)(如,spinlock, irq-handler…),將打印出堆棧的回溯信息。這個函數主要用來做調試工作,在你不確定不期望睡眠的地方是否真的不會睡眠時,就把這個宏加進去。



這個函數我在看代碼時基本上是直接忽略的(因爲我知道它實際上不幹什麼事),不過因爲內核中很多函數一開始就會用一下它,爲了方便那些正在學習內核源碼的網友,本帖專門討論一下該函數到底被內核用來幹什麼。

簡單地說,如果沒有調試的需求(絕大多數下你平常跑的系統都是release版本的kernel),那麼這個宏(或者函數,稱謂並不重要)什麼實質性的活都不幹,內核只是用它來做一件事,就是提醒你,調用該函數的函數可能會sleep,這個跟其名字也是匹配的: The function calling might_sleep() might sleep。如果你想看源碼,我把它列在下面:


點擊(此處)摺疊或打開

  1. # define might_resched() do { } while (0)
  2. # define might_sleep() do { might_resched(); } while (0)
看到沒,啥事都沒幹。其實內核源碼對此也有明確的註釋:might_sleep - annotation for functions that can sleep。所以對於release版的kernel image而言,might_sleep的作用僅僅是一個annotation,提醒使用者,一個使用might_sleep的函數在其後的代碼執行中可能會sleep。

不過如果有調試需求介入的話,比如你的系統莫名其妙地隨機性地crash掉,在經過一段艱難的案情分析排查之後,最後你決定打開內核的CONFIG_DEBUG_ATOMIC_SLEEP選項,那麼此時might_sleep對案情的進一步推進就可能產生貢獻了。CONFIG_DEBUG_ATOMIC_SLEEP選項主要用來排查是否在一個ATOMIC操作的上下文中有函數發生sleep行爲,關於什麼是ATOMIC操作,內核源碼在might_sleep函數前也有一段註釋:
this macro will print a stack trace if it is executed in an atomic context (spinlock, irq-handler, ...)

所以很明顯,一個進程獲得了spinlock之後它就進入了這裏所謂的atomic context,或者是在一個irq-handler,也就是一箇中斷上下文中。這兩種上下文中理論上不應該讓當前的execution path進入sleep狀態(雖然不是強制規定,換句話說,一個擁有spinlock的進程進入sleep並不必然意味着系統就一定會deadlock等,但是對內核編程而言,還是應該盡力避開這個雷區)。

在CONFIG_DEBUG_ATOMIC_SLEEP選項打開的情形下,might_sleep又有哪些特殊的功能呢?先看看內核中的源碼:


點擊(此處)摺疊或打開

  1. void __might_sleep(const char *file, int line, int preempt_offset)
  2. {
  3.         static unsigned long prev_jiffy; /* ratelimiting */

  4.         if ((preempt_count_equals(preempt_offset) && !irqs_disabled()) ||
  5.             system_state != SYSTEM_RUNNING || oops_in_progress)
  6.                 return;
  7.         if (time_before(jiffies, prev_jiffy + HZ) && prev_jiffy)
  8.                 return;
  9.         prev_jiffy = jiffies;

  10.         printk(KERN_ERR
  11.                 "BUG: sleeping function called from invalid context at %s:%d\n",
  12.                         file, line);
  13.         printk(KERN_ERR
  14.                 "in_atomic(): %d, irqs_disabled(): %d, pid: %d, name: %s\n",
  15.                         in_atomic(), irqs_disabled(),
  16.                         current->pid, current->comm);

  17.         if (irqs_disabled())
  18.                 print_irqtrace_events(current);
  19.         dump_stack();
  20. }
上面的代碼我進行了輕微的刪減,去除了一些只有CONFIG_DEBUG_ATOMIC_SLEEP選項使能的情形下不幹活的函數。


點擊(此處)摺疊或打開

  1. # define might_sleep() \
  2.         do { __might_sleep(__FILE__, __LINE__, 0); might_resched(); } while (0)
在當前CONFIG_DEBUG_ATOMIC_SLEEP選項使能的前提下, 可以看到__might_sleep還是幹了不少事情的,最主要的工作是在第一個if語句那裏,尤其是preempt_count_equals和 irqs_disabled,都是用來判斷當前的上下文是否是一個atomic context,因爲我們知道,只要進程獲得了spin_lock的任一個變種形式的lock,那麼無論是單處理器系統還是多處理器系統,都會導致preempt_count發生變化,而irq_disabled則是用來判斷當前中斷是否開啓。__might_sleep正是根據這些信息來判斷當前正在執行的代碼上下文是否是個atomic,如果不是,那麼函數就直接返回了,因爲一切正常。如果是,那麼代碼下行。

所以讓CONFIG_DEBUG_ATOMIC_SLEEP選項打開,可以捕捉到在一個atomic context中是否發生了sleep,如果你的代碼不小心在某處的確出現了這種情形,那麼might_sleep會通過後續的printk以及dump_stack來協助你發現這種情形。


至於__might_sleep函數中的system_state,它是一個全局性的enum型變量,主要用來記錄當前系統的狀態:

點擊(此處)摺疊或打開

  1. enum system_states system_state __read_mostly;
  2. EXPORT_SYMBOL(system_state);
注意system_state已經被export出來,所以內核模塊可以直接讀該值來判斷當前系統的運行狀態,常見的狀態包括:

點擊(此處)摺疊或打開

  1. extern enum system_states {
  2.     SYSTEM_BOOTING,
  3.     SYSTEM_RUNNING,
  4.     SYSTEM_HALT,
  5.     SYSTEM_POWER_OFF,
  6.     SYSTEM_RESTART,
  7.     SYSTEM_SUSPEND_DISK,
  8. } system_state;
最常見的狀態當然是SYSTEM_RUNNING了,你的系統正常起來之後就處於這個狀態。因爲跟當前的話題沒有直接的關聯,這裏只提一下好了。

發佈了5 篇原創文章 · 獲贊 12 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章