linux之fork函數淺析

轉自:http://blog.csdn.net/lingdxuyan/article/details/4993883

一、fork的介紹

fork函數的原型:

#include <sys/types.h>
#include <unistd.h>
/*
功能:複製進程
參數:無
返回值:  成功:  父進程:返回子進程id
                子進程:返回0
         失敗:  返回-1
*/
pid_t fork(void);

      由fork創建的新進程被稱爲子進程(child process)。該函數被調用一次,但返回兩次。兩次返回的區別是子進程的返回值是0,而父進程的返回值則是新進程(子進程)的進程 id。將子進程id返回給父進程的理由是:因爲一個進程的子進程可以多於一個,沒有一個函數使一個進程可以獲得其所有子進程的進程id。對子進程來說,之所以fork返回0給它,是因爲它隨時可以調用getpid()來獲取自己的pid;也可以調用getppid()來獲取父進程的id。(進程id 0總是由交換進程使用,所以一個子進程的進程id不可能爲0 )。

fork之後,操作系統會複製一個與父進程完全相同的子進程,雖說是父子關係,但是在操作系統看來,他們更像兄弟關係,這2個進程共享代碼空間,但是數據空間是互相獨立的,子進程數據空間中的內容是父進程的完整拷貝,指令指針也完全相同,子進程擁有父進程當前運行到的位置(兩進程的程序計數器pc值相同,也就是說,子進程是從fork返回處開始執行的),但有一點不同,如果fork成功,子進程中fork的返回值是0,父進程中fork的返回值是子進程的進程號,如果fork不成功,父進程會返回錯誤。
可以這樣想象,2個進程一直同時運行,而且步調一致,在fork之後,他們分別作不同的工作,也就是分岔了。這也是fork爲什麼叫fork的原因

至於那一個最先運行,可能與操作系統(調度算法)有關,而且這個問題在實際應用中並不重要,如果需要父子進程協同,可以通過原語的辦法解決。

二、實例

#include <unistd.h>
#include <sys/types.h>
#include <stdio.h>
int main(void)
{
	pid_t pid;
	pid=fork();
	switch (pid)
	{
	case -1:
		perror("fork error");
		exit(1);
	case 0:
		printf("I am the child process, my process id is %d/n", getpid());
		break;
	default:
		printf("I am the parent process, my process id is %d/n", getpid());
		break;
	}
     return 0;
} 

要搞清楚fork的執行過程,就必須先弄清楚操作系統中的“進程(process)”概念。一個進程,主要包含三個元素:
o. 一個可以執行的程序;
o. 和該進程相關聯的全部數據(包括變量,內存空間,緩衝區等等);
o. 程序的執行上下文(execution context)。

不妨簡單理解爲,一個進程表示的,就是一個可執行程序的一次執行過程中的一個狀態。操作系統對進程的管理,典型的情況,是通過進程表完成的。進程表中的每一個表項,記錄的是當前操作系統中一個進程的情況。對於單 CPU的情況而言,每一特定時刻只有一個進程佔用 CPU,但是系統中可能同時存在多個活動的(等待執行或繼續執行的)進程。
一個稱爲“程序計數器(program counter, pc)”的寄存器,指出當前佔用 CPU的進程要執行的下一條指令的位置。
當分給某個進程的 CPU時間已經用完,操作系統將該進程相關的寄存器的值,保存到該進程在進程表中對應的表項裏面;把將要接替這個進程佔用 CPU的那個進程的上下文,從進程表中讀出,並更新相應的寄存器(這個過程稱爲“上下文交換(process context switch)”,實際的上下文交換需要涉及到更多的數據,那和fork無關,不再多說,主要要記住程序寄存器pc記錄了程序當前已經執行到哪裏,是進程上下文的重要內容,換出 CPU的進程要保存這個寄存器的值,換入CPU的進程,也要根據進程表中保存的本進程執行上下文信息,更新這個寄存器)。
好了,有這些概念打底,可以說fork了。當你的程序執行到下面的語句:pid=fork(); 

操作系統創建一個新的進程(子進程),並且在進程表中相應爲它建立一個新的表項。新進程和原有進程的可執行程序是同一個程序;上下文和數據,絕大部分 就是原進程(父進程)的拷貝,但它們是兩個相互獨立的進程!此時程序寄存器pc,在父、子進程的上下文中都聲稱,這個進程目前執行到fork調用即將返回(此時子進程不佔有CPU,子進程的pc不是真正保存在寄存器中,而是作爲進程上下文保存在進程表中的對應表項內)。問題是怎麼返回,在父子進程中就分道揚鑣。

(假設父進程一直佔據CPU,實際情況很可能不一樣)父進程繼續執行,操作系統對fork的實現,使這個調用在父進程中返回剛剛創建的子進程的pid(一個正整數),所以下面的swtich語句中執行了default分支(case -1,case 0分支都不滿足)。所以輸出I am the parent process...

子進程在之後的某個時候得到調度,它的上下文被換入,佔據 CPU,操作系統對fork的實現,使得子進程中fork調用返回0,所以在這個進程(注意這不是父進程了哦,雖然是同一個程序,但是這是同一個程序的另外一次執行,在操作系統中這次執行是由另外一個進程表示的,從執行的角度說和父進程相互獨立)中pid=0。這個進程繼續執行的過程中,switch語句中 case -1不滿足,但是case 0是滿足。所以輸出I am the child process..

結果輸出:

Iam the parent process, my process id is 17807

Iam the child process, my process id is 17808

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章