避免殭屍進程的方法
何爲殭屍進程
- 如果父進程先退出,子進程自動被 init 進程收養,不會產生殭屍進程。
- 如果子進程先退出。父進程 wait() 處理(即父進程調用wait/waitpid方法來處理),則殭屍進程會被父進程清理;如果父進程不用 wait() 處理,則殭屍進程會在父進程退出之前一直存在。當然,父進程退出後,殭屍子進程會被 init 收養,init 進程會自動調用 wait() 處理。但是對於處理網絡請求的服務器進程來說,父進程可能會一直存在,子進程處理完任務就退出,這種情況下會產生很多殭屍進程,這種場景就需要對殭屍進程的處理提高警惕了。
避免產生殭屍進程的方法(每種方法都有自己適用的場景)
- fock twice。使用場景:一個進程要創建一個進程,兩個進程同時處理任務,誰也不耽誤誰。如果直接用子進程充當第二個進程的角色,那麼問題是這樣的:如果父進程處理時間長,子進程處理時間短,那麼如果父進程不 wait() 處理的話,子進程就會成爲殭屍進程,但如果父進程 wait() 子進程的話,父進程就會阻塞,所有有個方法就是讓自己儘快推出,任務讓子進程的子進程來處理。
/*
* Avoid zombie processes by calling fork twice.
* APUE-2e 程序清單8-5
*/
#include <unistd.h>
#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
int main()
{
pid_t pid;
if( (pid = fork()) < 0 )
{
printf("fork error.\n");
exit(-1);
}
else if(pid == 0) /* first child */
{
if( (pid = fork()) < 0 )
{
printf("fork error.\n");
exit(-1);
}
else if(pid > 0)
{
exit(0);
}
/* We're the second child; our parent becomes init as soon as our real parent exits. */
printf("second child, parent pid = %d\n", getppid());
/* ---------------handle tasks--------------- */
exit(0);
}
if(waitpid(pid, NULL, 0) != pid) /* wait for first child */
{
printf("waitpid error.\n");
exit(1);
}
printf("parent, first child pid = %d\n", pid);
/* ---------------handle tasks--------------- */
exit(0);
}
- 父進程調用wait()方法,但是會使父進程阻塞
- signal(sigchld,sig_ign),並不是所有系統都兼容。通過signal(SIGCHLD, SIG_IGN)通知內核對子進程的結束不關心,由內核回收,即可讓內核把殭屍子進程轉交給init進程去處理,省去了大量殭屍進程佔用系統資源。
- sigaction+sa_nocldwait,並不是所有系統兼容
- 在signal handler函數中調用 waitpid (下面的例子能說明用 waitpid 而不用 wait的原因:我們必須指定WOHOANG option——這告訴waitpid不要阻止是否有正在運行的子節點),這樣父進程不用阻塞。適用場景: one-request-one-process 的網絡服務器程序
- 讓殭屍進程變成孤兒進程,由init回收,就是讓父親先死
void sig_chld(int signo)
{
pid_t pid;
int stat;
while ( (pid = waitpid(-1, &stat, WNOHANG)) > 0 )
{
printf("child %d terminated\n", pid);
}
return;
}
建立信號處理程序並從該處理程序調用wait不足以防止殭屍。 問題是如果在執行信號處理程序之前生成五個信號,則信號處理程序只執行一次,因爲Unix信號通常不排隊(這種情況下只會產生一次“SIGCHLD”信號)。在這種情況下,信號處理程序執行一次,留下四個殭屍。故正確的解決方案是調用waitpid而不是wait,並且我們必須指定WOHOANGoption:這告訴waitpid不要阻止是否有正在運行的子節點還沒有終止。
wait與waitpid的區別
pid_t wait(int *status);
pid_t waitpd(pid_t pid, int *status, int options);
-
wait
進程一旦調用了wait,就立即阻塞自己,由wait自動分析是否當前進程的某個子進程已經退出,如果讓它找到了這樣一個已經變成殭屍的子進程,wait就會收集這個子進程的信息,並把它徹底銷燬後返回;如果沒有找到這樣一個子進程,wait就會一直阻塞在這裏,直到有一個出現爲止。
參數status用來保存被收集進程退出時的一些狀態,它是一個指向int類型的指針。但如果我們對這個子進程是如何死掉的毫不在意,只想把這個殭屍進程消滅掉,(事實上絕大多數情況下,我們都會這樣想),我們就可以設定這個參數爲NULL,就象下面這樣:pid = wait(NULL);
返回值:
- 如果成功,wait會返回被收集的子進程的進程ID
-
如果調用進程沒有子進程,調用就會失敗,此時wait返回-1,同時errno被置爲ECHILD。
-
waitpid
從本質上講,系統調用waitpid和wait的作用是完全相同的,但waitpid多出了兩個可由用戶控制的參數pid和options,從而爲我們編程提供了另一種更靈活的方式。
pid:從參數的名字pid和類型pid_t中就可以看出,這裏需要的是一個進程ID。但當pid取不同的值時,在這裏有不同的意義。
- pid>0時,只等待進程ID等於pid的子進程,不管其它已經有多少子進程運行結束退出了,只要指定的子進程還沒有結束,waitpid就會一直等下去。
- pid=-1時,等待任何一個子進程退出,沒有任何限制,此時waitpid和wait的作用一模一樣。
- pid=0時,等待同一個進程組中的任何子進程,如果子進程已經加入了別的進程組,waitpid不會對它做任何理睬。
- pid<-1時,等待一個指定進程組中的任何子進程,這個進程組的ID等於pid的絕對值。
options: options提供了一些額外的選項來控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED兩個選項,這是兩個常數,可以用"|"運算符把它們連接起來使用,如果我們不想使用它們,也可以把options設爲0。
返回值——waitpid的返回值比wait稍微複雜一些,一共有3種情況:
- 當正常返回的時候,waitpid返回收集到的子進程的進程ID;
- 如果設置了選項WNOHANG,而調用中waitpid發現沒有已退出的子進程可收集,則返回0;
- 如果調用中出錯,則返回-1,這時errno會被設置成相應的值以指示錯誤所在;當pid所指示的子進程不存在,或此進程存在,但不是調用進程的子進程,waitpid就會出錯返回,這時errno被設置爲ECHILD
wait與waitpid的區別:waitpid提供了wait不能實現的功能
- waitpid等待特定的子進程, 而wait則返回任一終止狀態的子進程;
- waitpid提供了一個wait的非阻塞版本;
- waitpid支持作業控制(以WUNTRACED選項). 用於檢查wait和waitpid兩個函數返回終止狀態的宏: 這兩個函數返回的子進程狀態都保存在status指針中, 用以下3個宏可以檢查該狀態:
- WIFEXITED(status): 若爲正常終止, 則爲真. 此時可執行 WEXITSTATUS(status): 取子進程傳送給exit或_exit參數的低8位.
- WIFSIGNALED(status): 若爲異常終止, 則爲真.此時可執行 WTERMSIG(status): 取使子進程終止的信號編號
- WIFSTOPPED(status): 若爲當前暫停子進程, 則爲真. 此時可執行 WSTOPSIG(status): 取使子進程暫停的信號編號