fork()、 vfork()、 clone()的區別

原文地址:http://blog.chinaunix.net/uid-27164517-id-3281349.html

首先說明Linux下的進程與線程比較相近。這麼說的一個原因是它們都需要相同的數據結構來表示,即task_struct。區別在於一個有獨立的用戶空間,一個是共享的用戶空間(如果完全沒有用戶空間則是內核線程,不需要)。


Linux的用戶進程不能直接被創建出來,因爲不存在這樣的API。它只能從某個進程中複製出來,再通過exec這樣的API來切換到實際想要運行的程序文件。


複製的API包括三種:fork、clone、vfork。


這三個API的內部實際都是調用一個內核內部函數do_fork,只是填寫的參數不同而已。


vfork,其實就是fork的部分過程,用以簡化並提高效率。而fork與clone是區別的。fork是進程資源的完全複製,包括進程的PCB、線程的系統堆棧、進程的用戶空間、進程打開的設備等。而在clone中其實只有前兩項是被複制了的,後兩項都與父進程共享。


在四項資源的複製中,用戶空間是相對龐大的,如果完全複製則效率會很低。在Linux中採用的“寫時複製”技術,也就是說,fork執行時並不真正複製用戶空間的所有頁面,而只是複製頁面表。這樣,無論父進程還是子進程,當發生用戶空間的寫操作時,都會引發“寫複製”操作,而另行分配一塊可用的用戶空間,使其完全獨立。這是一種提高效率的非常有效的方法。


而對於clone來說,它們連這些頁面表都是與父進程共享,故而是真正意義上的共享,因此對共享數據的保護必須有上層應用來保證。


在linux源碼中這三個調用的執行過程是執行fork(),vfork(),clone()時,通過一個系統調用表映射到sys_fork(),sys_vfork(),sys_clone(),再在這三個函數中去調用do_fork()去做具體的創建進程工作。


fork:
fork創建一個進程時,子進程只是完全複製父進程的資源,複製出來的子進程有自己的task_struct結構和pid,但卻複製父進程其它所有的資源。例如,要是父進程打開了五個文件,那麼子進程也有五個打開的文件,而且這些文件的當前讀寫指針也停在相同的地方。所以,這一步所做的是複製。這樣得到的子進程獨立於父進程, 具有良好的併發性,但是二者之間的通訊需要通過專門的通訊機制,如:pipe,共享內存等機制, 另外通過fork創建子進程,需要將上面描述的每種資源都複製一個副本。
這樣看來,fork是一個開銷十分大的系統調用,這些開銷並不是所有的情況下都是必須的,比如某進程fork出一個子進程後,其子進程僅僅是爲了調用exec執行另一個可執行文件,那麼在fork過程中對於虛存空間的複製將是一個多餘的過程。但由於現在Linux中是採取了copy-on-write(COW寫時複製)技術,爲了降低開銷,fork最初並不會真的產生兩個不同的拷貝,因爲在那個時候,大量的數據其實完全是一樣的。寫時複製是在推遲真正的數據拷貝。若後來確實發生了寫入,那意味着parent和child的數據不一致了,於是產生複製動作,每個進程拿到屬於自己的那一份,這樣就可以降低系統調用的開銷。所以有了寫時複製後呢,vfork其實現意義就不大了。
fork()調用執行一次返回兩個值,對於父進程,fork函數返回子程序的進程號,而對於子程序,fork函數則返回零,這就是一個函數返回兩次的本質。
在fork之後,子進程和父進程都會繼續執行fork調用之後的指令。子進程是父進程的副本。它將獲得父進程的數據空間,堆和棧的副本,這些都是副本,父子進程並不共享這部分的內存。也就是說,子進程對父進程中的同名變量進行修改並不會影響其在父進程中的值。但是父子進程又共享一些東西,簡單說來就是程序的正文段。正文段存放着由cpu執行的機器指令,通常是read-only的。


vfork:
vfork系統調用不同於fork,用vfork創建的子進程與父進程共享地址空間,也就是說子進程完全運行在父進程的地址空間上,如果這時子進程修改了某個變量,這將影響到父進程。
       其次,子進程在vfork()返回後直接運行在父進程的棧空間,並使用父進程的內存和數據。這意味着子進程可能破壞父進程的數據結構或棧,造成失敗。爲了避免這些問題,需要確保一旦調用vfork(),子進程就不從當前的棧框架中返回,並且如果子進程改變了父進程的數據結構就不能調用exit函數。子進程還必須避免改變全局數據結構或全局變量中的任何信息,因爲這些改變都有可能使父進程不能繼續。
但此處有一點要注意的是用vfork()創建的子進程必須顯示調用exit()來結束,否則子進程將不能結束,而fork()則不存在這個情況。
vfork也是在父進程中返回子進程的進程號,在子進程中返回0。
用vfork創建子進程後,父進程會被阻塞直到子進程調用exec(exec,將一個新的可執行文件載入到地址空間並執行之。)或exit。vfork的好處是在子進程被創建後往往僅僅是爲了調用exec執行另一個程序,因爲它就不會對父進程的地址空間有任何引用,所以對地址空間的複製是多餘的 ,因此通過vfork共享內存可以減少不必要的開銷
再次強調:在使用vfork()時,必須在子進程中調用exit()函數調用,否則會出現:__new_exitfn: Assertion `l != ((void *)0)' failed 錯誤!而且,現在這個函數已經很少使用了!


clone:
    系統調用fork()和vfork()是無參數的,而clone()則帶有參數。fork()是全部複製,vfork()是共享內存,而clone()是則可以將父進程資源有選擇地複製給子進程,而沒有複製的數據結構則通過指針的複製讓子進程共享,具體要複製哪些資源給子進程,由參數列表中的clone_flags決決定。
fork不對父子進程的執行次序進行任何限制,fork返回後,子進程和父進程都從調用fork函數的下一條語句開始行,但父子進程運行順序是不定的,它取決於內核的調度算法;而在vfork調用中,子進程先運行,父進程掛起,直到子進程調用了exec或exit之後,父子進程的執行次序纔不再有限制;clone中由標誌CLONE_VFORK來決定子進程在執行時父進程是阻塞還是運行,若沒有設置該標誌,則父子進程同時運行,設置了該標誌,則父進程掛起,直到子進程結束爲止。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章