linux系統調用之-fork、wait、waitpid

轉自:https://blog.csdn.net/hzrandd/article/details/50774928

在前面的文章中,我們已經瞭解了父進程和子進程的概念,並已經掌握了系統調用exit的用法,但可能很少有人意識到,在一個進程調用了exit之後,該進程並非馬上就消失掉,而是留下一個稱爲殭屍進程(Zombie)的數據結構。在Linux進程的5種狀態中,殭屍進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,殭屍進程不再佔有任何內存空間。從這點來看,殭屍進程雖然有一個很酷的名字,但它的影響力遠遠抵不上那些真正的殭屍兄弟,真正的殭屍總能令人感到恐怖,而殭屍進程卻除了留下一些供人憑弔的信息,對系統毫無作用。
也許讀者們還對這個新概念比較好奇,那就讓我們來看一眼Linux裏的殭屍進程究竟長什麼樣子。
當一個進程已退出,但其父進程還沒有調用系統調用wait(稍後介紹)對其進行收集之前的這段時間裏,它會一直保持殭屍狀態,利用這個特點,我們來寫一個簡單的小程序:
/* zombie.c */
#include <sys/types.h>
#include <unistd.h>
main()
{
pid_t pid;

pid=fork();
if(pid<0) /* 如果出錯 */
printf("error occurred!\n");
else if(pid==0) /* 如果是子進程 */
exit(0);
else /* 如果是父進程 */
sleep(60); /* 休眠60秒,這段時間裏,父進程什麼也幹不了 */
wait(NULL); /* 收集殭屍進程 */
}
sleep的作用是讓進程休眠指定的秒數,在這60秒內,子進程已經退出,而父進程正忙着睡覺,不可能對它進行收集,這樣,我們就能保持子進程60秒的殭屍狀態。
編譯這個程序:
$ cc zombie.c -o zombie
後臺運行程序,以使我們能夠執行下一條命令
$ ./zombie &
[1] 1577
列一下系統內的進程
$ ps -ax
...  ...
 1177 pts/0    S      0:00 -bash
 1577 pts/0    S      0:00 ./zombie
 1578 pts/0    Z      0:00 [zombie <defunct>]
 1579 pts/0    R      0:00 ps -ax
看到中間的"Z"了嗎?那就是殭屍進程的標誌,它表示1578號進程現在就是一個殭屍進程。
我們已經學習了系統調用exit,它的作用是使進程退出,但也僅僅限於將一個正常的進程變成一個殭屍進程,並不能將其完全銷燬。殭屍進程雖然對其他進程幾乎沒有什麼影響,不佔用CPU時間,消耗的內存也幾乎可以忽略不計,但有它在那裏呆着,還是讓人覺得心裏很不舒服。而且Linux系統中進程數目是有限制的,在一些特殊的情況下,如果存在太多的殭屍進程,也會影響到新進程的產生。那麼,我們該如何來消滅這些殭屍進程呢?
先來了解一下殭屍進程的來由,我們知道,Linux和UNIX總有着剪不斷理還亂的親緣關係,殭屍進程的概念也是從UNIX上繼承來的,而UNIX的先驅們設計這個東西並非是因爲閒來無聊想煩煩其他的程序員。殭屍進程中保存着很多對程序員和系統管理員非常重要的信息,首先,這個進程是怎麼死亡的?是正常退出呢,還是出現了錯誤,還是被其它進程強迫退出的?其次,這個進程佔用的總系統CPU時間和總用戶CPU時間分別是多少?發生頁錯誤的數目和收到信號的數目。這些信息都被存儲在殭屍進程中,試想如果沒有殭屍進程,進程一退出,所有與之相關的信息都立刻歸於無形,而此時程序員或系統管理員需要用到,就只好乾瞪眼了。
那麼,我們如何收集這些信息,並終結這些殭屍進程呢?就要靠我們下面要講到的waitpid調用和wait調用。這兩者的作用都是收集殭屍進程留下的信息,同時使這個進程徹底消失。下面就對這兩個調用分別作詳細介紹。
1.8 wait
1.8.1 簡介
wait的函數原型是:
#include <sys/types.h> /* 提供類型pid_t的定義 */
#include <sys/wait.h>
pid_t wait(int *status)
進程一旦調用了wait,就立即阻塞自己,由wait自動分析是否當前進程的某個子進程已經退出,如果讓它找到了這樣一個已經變成殭屍的子進程,wait就會收集這個子進程的信息,並把它徹底銷燬後返回;如果沒有找到這樣一個子進程,wait就會一直阻塞在這裏,直到有一個出現爲止。
參數status用來保存被收集進程退出時的一些狀態,它是一個指向int類型的指針。但如果我們對這個子進程是如何死掉的毫不在意,只想把這個殭屍進程消滅掉,(事實上絕大多數情況下,我們都會這樣想),我們就可以設定這個參數爲NULL,就象下面這樣:
pid = wait(NULL);
如果成功,wait會返回被收集的子進程的進程ID,如果調用進程沒有子進程,調用就會失敗,此時wait返回-1,同時errno被置爲ECHILD。
1.8.2 實戰
下面就讓我們用一個例子來實戰應用一下wait調用,程序中用到了系統調用fork,如果你對此不大熟悉或已經忘記了,請參考上一篇文章《進程管理相關的系統調用(一)》。
/* wait1.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
main()
{
pid_t pc,pr;
pc=fork();
if(pc<0) /* 如果出錯 */
printf("error ocurred!\n");
else if(pc==0){ /* 如果是子進程 */ 
printf("This is child process with pid of %d\n",getpid());
sleep(10); /* 睡眠10秒鐘 */
}
else{ /* 如果是父進程 */
pr=wait(NULL); /* 在這裏等待 */
printf("I catched a child process with pid of %d\n"),pr);
}
exit(0);
}
編譯並運行:
$ cc wait1.c -o wait1
$ ./wait1
This is child process with pid of 1508
I catched a child process with pid of 1508
可以明顯注意到,在第2行結果打印出來前有10秒鐘的等待時間,這就是我們設定的讓子進程睡眠的時間,只有子進程從睡眠中甦醒過來,它才能正常退出,也就才能被父進程捕捉到。其實這裏我們不管設定子進程睡眠的時間有多長,父進程都會一直等待下去,讀者如果有興趣的話,可以試着自己修改一下這個數值,看看會出現怎樣的結果。
1.8.3 參數status
如果參數status的值不是NULL,wait就會把子進程退出時的狀態取出並存入其中,這是一個整數值(int),指出了子進程是正常退出還是被非正常結束的(一個進程也可以被其他進程用信號結束,我們將在以後的文章中介紹),以及正常結束時的返回值,或被哪一個信號結束的等信息。由於這些信息被存放在一個整數的不同二進制位中,所以用常規的方法讀取會非常麻煩,人們就設計了一套專門的宏(macro)來完成這項工作,下面我們來學習一下其中最常用的兩個:
1,WIFEXITED(status) 這個宏用來指出子進程是否爲正常退出的,如果是,它會返回一個非零值。
(請注意,雖然名字一樣,這裏的參數status並不同於wait唯一的參數--指向整數的指針status,而是那個指針所指向的整數,切記不要搞混了。)
2,WEXITSTATUS(status) 當WIFEXITED返回非零值時,我們可以用這個宏來提取子進程的返回值,如果子進程調用exit(5)退出,WEXITSTATUS(status)就會返回5;如果子進程調用exit(7),WEXITSTATUS(status)就會返回7。請注意,如果進程不是正常退出的,也就是說,WIFEXITED返回0,這個值就毫無意義。
下面通過例子來實戰一下我們剛剛學到的內容:
/* wait2.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
int status;
pid_t pc,pr;
pc=fork();
if(pc<0) /* 如果出錯 */
printf("error ocurred!\n");
else if(pc==0){ /* 子進程 */
printf("This is child process with pid of %d.\n",getpid());
exit(3); /* 子進程返回3 */
}
else{ /* 父進程 */
pr=wait(&status);
if(WIFEXITED(status)){ /* 如果WIFEXITED返回非零值 */
printf("the child process %d exit normally.\n",pr);
printf("the return code is %d.\n",WEXITSTATUS(status));
}else /* 如果WIFEXITED返回零 */
printf("the child process %d exit abnormally.\n",pr);
}
}
編譯並運行:
$ cc wait2.c -o wait2
$ ./wait2
This is child process with pid of 1538.
the child process 1538 exit normally.
the return code is 3.
父進程準確捕捉到了子進程的返回值3,並把它打印了出來。
當然,處理進程退出狀態的宏並不止這兩個,但它們當中的絕大部分在平時的編程中很少用到,就也不在這裏浪費篇幅介紹了,有興趣的讀者可以自己參閱Linux man pages去了解它們的用法。
1.8.4 進程同步
有時候,父進程要求子進程的運算結果進行下一步的運算,或者子進程的功能是爲父進程提供了下一步執行的先決條件(如:子進程建立文件,而父進程寫入數據),此時父進程就必須在某一個位置停下來,等待子進程運行結束,而如果父進程不等待而直接執行下去的話,可以想見,會出現極大的混亂。這種情況稱爲進程之間的同步,更準確地說,這是進程同步的一種特例。進程同步就是要協調好2個以上的進程,使之以安排好地次序依次執行。解決進程同步問題有更通用的方法,我們將在以後介紹,但對於我們假設的這種情況,則完全可以用wait系統調用簡單的予以解決。請看下面這段程序:
#include <sys/types.h>
#include <sys/wait.h>
main()
{
pid_t pc, pr;
int status;

pc=fork();

if(pc<0)
printf("Error occured on forking.\n");
else if(pc==0){
/* 子進程的工作 */
exit(0);
}else{
/* 父進程的工作 */
pr=wait(&status);
/* 利用子進程的結果 */
}
}
這段程序只是個例子,不能真正拿來執行,但它卻說明了一些問題,首先,當fork調用成功後,父子進程各做各的事情,但當父進程的工作告一段落,需要用到子進程的結果時,它就停下來調用wait,一直等到子進程運行結束,然後利用子進程的結果繼續執行,這樣就圓滿地解決了我們提出的進程同步問題。


1.9 waitpid
1.9.1 簡介
waitpid系統調用在Linux函數庫中的原型是:
#include <sys/types.h> /* 提供類型pid_t的定義 */
#include <sys/wait.h>
pid_t waitpid(pid_t pid,int *status,int options)
從本質上講,系統調用waitpid和wait的作用是完全相同的,但waitpid多出了兩個可由用戶控制的參數pid和options,從而爲我們編程提供了另一種更靈活的方式。下面我們就來詳細介紹一下這兩個參數:
pid
從參數的名字pid和類型pid_t中就可以看出,這裏需要的是一個進程ID。但當pid取不同的值時,在這裏有不同的意義。
pid>0時,只等待進程ID等於pid的子進程,不管其它已經有多少子進程運行結束退出了,只要指定的子進程還沒有結束,waitpid就會一直等下去。
pid=-1時,等待任何一個子進程退出,沒有任何限制,此時waitpid和wait的作用一模一樣。
pid=0時,等待同一個進程組中的任何子進程,如果子進程已經加入了別的進程組,waitpid不會對它做任何理睬。
pid<-1時,等待一個指定進程組中的任何子進程,這個進程組的ID等於pid的絕對值。
options
options提供了一些額外的選項來控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED兩個選項,這是兩個常數,可以用"|"運算符把它們連接起來使用,比如:
ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);
如果我們不想使用它們,也可以把options設爲0,如:
ret=waitpid(-1,NULL,0);
如果使用了WNOHANG參數調用waitpid,即使沒有子進程退出,它也會立即返回,不會像wait那樣永遠等下去。
而WUNTRACED參數,由於涉及到一些跟蹤調試方面的知識,加之極少用到,這裏就不多費筆墨了,有興趣的讀者可以自行查閱相關材料。
看到這裏,聰明的讀者可能已經看出端倪了--wait不就是經過包裝的waitpid嗎?沒錯,察看<內核源碼目錄>/include/unistd.h文件349-352行就會發現以下程序段:
static inline pid_t wait(int * wait_stat)
{
return waitpid(-1,wait_stat,0);
}
1.9.2 返回值和錯誤
waitpid的返回值比wait稍微複雜一些,一共有3種情況:
當正常返回的時候,waitpid返回收集到的子進程的進程ID;
如果設置了選項WNOHANG,而調用中waitpid發現沒有已退出的子進程可收集,則返回0;
如果調用中出錯,則返回-1,這時errno會被設置成相應的值以指示錯誤所在;
當pid所指示的子進程不存在,或此進程存在,但不是調用進程的子進程,waitpid就會出錯返回,這時errno被設置爲ECHILD;
/* waitpid.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
pid_t pc, pr;

pc=fork();
if(pc<0) /* 如果fork出錯 */
printf("Error occured on forking.\n");
else if(pc==0){ /* 如果是子進程 */
sleep(10); /* 睡眠10秒 */
exit(0);
}
/* 如果是父進程 */
do{
pr=waitpid(pc, NULL, WNOHANG); /* 使用了WNOHANG參數,waitpid不會在這裏等待 */
if(pr==0){ /* 如果沒有收集到子進程 */
printf("No child exited\n");
sleep(1);
}
}while(pr==0); /* 沒有收集到子進程,就回去繼續嘗試 */
if(pr==pc)
printf("successfully get child %d\n", pr);
else
printf("some error occured\n");
}
編譯並運行:
$ cc waitpid.c -o waitpid
$ ./waitpid
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
successfully get child 1526
父進程經過10次失敗的嘗試之後,終於收集到了退出的子進程。
因爲這只是一個例子程序,不便寫得太複雜,所以我們就讓父進程和子進程分別睡眠了10秒鐘和1秒鐘,代表它們分別作了10秒鐘和1秒鐘的工作。父子進程都有工作要做,父進程利用工作的簡短間歇察看子進程的是否退出,如退出就收集它。


1.10 exec
也許有不少讀者從本系列文章一推出就開始讀,一直到這裏還有一個很大的疑惑:既然所有新進程都是由fork產生的,而且由fork產生的子進程和父進程幾乎完全一樣,那豈不是意味着系統中所有的進程都應該一模一樣了嗎?而且,就我們的常識來說,當我們執行一個程序的時候,新產生的進程的內容應就是程序的內容纔對。是我們理解錯了嗎?顯然不是,要解決這些疑惑,就必須提到我們下面要介紹的exec系統調用。
1.10.1 簡介
說是exec系統調用,實際上在Linux中,並不存在一個exec()的函數形式,exec指的是一組函數,一共有6個,分別是:
#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
其中只有execve是真正意義上的系統調用,其它都是在此基礎上經過包裝的庫函數。
exec函數族的作用是根據指定的文件名找到可執行文件,並用它來取代調用進程的內容,換句話說,就是在調用進程內部執行一個可執行文件。這裏的可執行文件既可以是二進制文件,也可以是任何Linux下可執行的腳本文件。
與一般情況不同,exec函數族的函數執行成功後不會返回,因爲調用進程的實體,包括代碼段,數據段和堆棧等都已經被新的內容取代,只留下進程ID等一些表面上的信息仍保持原樣,頗有些神似"三十六計"中的"金蟬脫殼"。看上去還是舊的軀殼,卻已經注入了新的靈魂。只有調用失敗了,它們纔會返回一個-1,從原程序的調用點接着往下執行。
現在我們應該明白了,Linux下是如何執行新程序的,每當有進程認爲自己不能爲系統和擁護做出任何貢獻了,他就可以發揮最後一點餘熱,調用任何一個exec,讓自己以新的面貌重生;或者,更普遍的情況是,如果一個進程想執行另一個程序,它就可以fork出一個新進程,然後調用任何一個exec,這樣看起來就好像通過執行應用程序而產生了一個新進程一樣。
事實上第二種情況被應用得如此普遍,以至於Linux專門爲其作了優化,我們已經知道,fork會將調用進程的所有內容原封不動的拷貝到新產生的子進程中去,這些拷貝的動作很消耗時間,而如果fork完之後我們馬上就調用exec,這些辛辛苦苦拷貝來的東西又會被立刻抹掉,這看起來非常不划算,於是人們設計了一種"寫時拷貝(copy-on-write)"技術,使得fork結束後並不立刻複製父進程的內容,而是到了真正實用的時候才複製,這樣如果下一條語句是exec,它就不會白白作無用功了,也就提高了效率。
1.10.2 稍稍深入
上面6條函數看起來似乎很複雜,但實際上無論是作用還是用法都非常相似,只有很微小的差別。在學習它們之前,先來了解一下我們習以爲常的main函數。
下面這個main函數的形式可能有些出乎我們的意料:
int main(int argc, char *argv[], char *envp[])
它可能與絕大多數教科書上描述的都不一樣,但實際上,這纔是main函數真正完整的形式。
參數argc指出了運行該程序時命令行參數的個數,數組argv存放了所有的命令行參數,數組envp存放了所有的環境變量。環境變量指的是一組值,從用戶登錄後就一直存在,很多應用程序需要依靠它來確定系統的一些細節,我們最常見的環境變量是PATH,它指出了應到哪裏去搜索應用程序,如/bin;HOME也是比較常見的環境變量,它指出了我們在系統中的個人目錄。環境變量一般以字符串"XXX=xxx"的形式存在,XXX表示變量名,xxx表示變量的值。
值得一提的是,argv數組和envp數組存放的都是指向字符串的指針,這兩個數組都以一個NULL元素表示數組的結尾。
我們可以通過以下這個程序來觀看傳到argc、argv和envp裏的都是什麼東西:
/* main.c */
int main(int argc, char *argv[], char *envp[])
{
printf("\n### ARGC ###\n%d\n", argc);
printf("\n### ARGV ###\n");
while(*argv)
printf("%s\n", *(argv++));
printf("\n### ENVP ###\n");
while(*envp)
printf("%s\n", *(envp++));
return 0;
}
編譯它:
$ cc main.c -o main
運行時,我們故意加幾個沒有任何作用的命令行參數:
$ ./main -xx 000
### ARGC ###
3
### ARGV ###
./main
-xx
000
### ENVP ###
PWD=/home/lei
REMOTEHOST=dt.laser.com
HOSTNAME=localhost.localdomain
QTDIR=/usr/lib/qt-2.3.1
LESSOPEN=|/usr/bin/lesspipe.sh %s
KDEDIR=/usr
USER=lei
LS_COLORS=
MACHTYPE=i386-redhat-linux-gnu
MAIL=/var/spool/mail/lei
INPUTRC=/etc/inputrc
LANG=en_US
LOGNAME=lei
SHLVL=1
SHELL=/bin/bash
HOSTTYPE=i386
OSTYPE=linux-gnu
HISTSIZE=1000
TERM=ansi
HOME=/home/lei
PATH=/usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/lei/bin
_=./main
我們看到,程序將"./main"作爲第1個命令行參數,所以我們一共有3個命令行參數。這可能與大家平時習慣的說法有些不同,小心不要搞錯了。
現在回過頭來看一下exec函數族,先把注意力集中在execve上:
int execve(const char *path, char *const argv[], char *const envp[]);
對比一下main函數的完整形式,看出問題了嗎?是的,這兩個函數裏的argv和envp是完全一一對應的關係。execve第1個參數path是被執行應用程序的完整路徑,第2個參數argv就是傳給被執行應用程序的命令行參數,第3個參數envp是傳給被執行應用程序的環境變量。
留心看一下這6個函數還可以發現,前3個函數都是以execl開頭的,後3個都是以execv開頭的,它們的區別在於,execv開頭的函數是以"char *argv[]"這樣的形式傳遞命令行參數,而execl開頭的函數採用了我們更容易習慣的方式,把參數一個一個列出來,然後以一個NULL表示結束。這裏的NULL的作用和argv數組裏的NULL作用是一樣的。
在全部6個函數中,只有execle和execve使用了char *envp[]傳遞環境變量,其它的4個函數都沒有這個參數,這並不意味着它們不傳遞環境變量,這4個函數將把默認的環境變量不做任何修改地傳給被執行的應用程序。而execle和execve會用指定的環境變量去替代默認的那些。
還有2個以p結尾的函數execlp和execvp,咋看起來,它們和execl與execv的差別很小,事實也確是如此,除execlp和execvp之外的4個函數都要求,它們的第1個參數path必須是一個完整的路徑,如"/bin/ls";而execlp和execvp的第1個參數file可以簡單到僅僅是一個文件名,如"ls",這兩個函數可以自動到環境變量PATH制定的目錄裏去尋找。
1.10.3 實戰
知識介紹得差不多了,接下來我們看看實際的應用:
/* exec.c */
#include <unistd.h>
main()
{
char *envp[]={"PATH=/tmp",
"USER=lei",
"STATUS=testing",
NULL};
char *argv_execv[]={"echo", "excuted by execv", NULL};
char *argv_execvp[]={"echo", "executed by execvp", NULL};
char *argv_execve[]={"env", NULL};
if(fork()==0)
if(execl("/bin/echo", "echo", "executed by execl", NULL)<0)
perror("Err on execl");
if(fork()==0)
if(execlp("echo", "echo", "executed by execlp", NULL)<0)
perror("Err on execlp");
if(fork()==0)
if(execle("/usr/bin/env", "env", NULL, envp)<0)
perror("Err on execle");
if(fork()==0)
if(execv("/bin/echo", argv_execv)<0)
perror("Err on execv");
if(fork()==0)
if(execvp("echo", argv_execvp)<0)
perror("Err on execvp");
if(fork()==0)
if(execve("/usr/bin/env", argv_execve, envp)<0)
perror("Err on execve");
}
程序裏調用了2個Linux常用的系統命令,echo和env。echo會把後面跟的命令行參數原封不動的打印出來,env用來列出所有環境變量。
由於各個子進程執行的順序無法控制,所以有可能出現一個比較混亂的輸出--各子進程打印的結果交雜在一起,而不是嚴格按照程序中列出的次序。
編譯並運行:
$ cc exec.c -o exec
$ ./exec
executed by execl
PATH=/tmp
USER=lei
STATUS=testing
executed by execlp
excuted by execv
executed by execvp
PATH=/tmp
USER=lei
STATUS=testing
果然不出所料,execle輸出的結果跑到了execlp前面。
大家在平時的編程中,如果用到了exec函數族,一定記得要加錯誤判斷語句。因爲與其他系統調用比起來,exec很容易受傷,被執行文件的位置,權限等很多因素都能導致該調用的失敗。最常見的錯誤是:
找不到文件或路徑,此時errno被設置爲ENOENT;
數組argv和envp忘記用NULL結束,此時errno被設置爲EFAULT;
沒有對要執行文件的運行權限,此時errno被設置爲EACCES。


1.11 進程的一生
下面就讓我用一些形象的比喻,來對進程短暫的一生作一個小小的總結:
隨着一句fork,一個新進程呱呱落地,但它這時只是老進程的一個克隆。
然後隨着exec,新進程脫胎換骨,離家獨立,開始了爲人民服務的職業生涯。
人有生老病死,進程也一樣,它可以是自然死亡,即運行到main函數的最後一個"}",從容地離我們而去;也可以是自殺,自殺有2種方式,一種是調用exit函數,一種是在main函數內使用return,無論哪一種方式,它都可以留下遺書,放在返回值裏保留下來;它還甚至能可被謀殺,被其它進程通過另外一些方式結束他的生命。
進程死掉以後,會留下一具殭屍,wait和waitpid充當了殮屍工,把殭屍推去火化,使其最終歸於無形。
這就是進程完整的一生。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章