進程創建:fork、vfork、clone

轉自:http://blog.csdn.net/zjg555543/article/details/7419098
在Linux中主要提供了fork、vfork、clone三個進程創建方法。 
在linux源碼中這三個調用的執行過程是執行fork(),vfork(),clone()時,通過一個系統調用表映射到sys_fork(),sys_vfork(),sys_clone(),再在這三個函數中去調用do_fork()去做具體的創建進程工作。 

fork 
   fork創建一個進程時,子進程只是完全複製父進程的資源,複製出來的子進程有自己的task_struct結構和pid,但卻複製父進程其它所有的資源。例如,要是父進程打開了五個文件,那麼子進程也有五個打開的文件,而且這些文件的當前讀寫指針也停在相同的地方。所以,這一步所做的是複製。這樣得到的子進程獨立於父進程, 具有良好的併發性,但是二者之間的通訊需要通過專門的通訊機制,如:pipe,共享內存等機制,另外通過fork創建子進程,需要將上面描述的每種資源都複製一個副本。這樣看來,fork是一個開銷十分大的系統調用,這些開銷並不是所有的情況下都是必須的,比如某進程fork出一個子進程後,其子進程僅僅是爲了調用exec執行另一個可執行文件,那麼在fork過程中對於虛存空間的複製將是一個多餘的過程。但由於現在Linux中是採取了copy-on-write(COW寫時複製)技術,爲了降低開銷,fork最初並不會真的產生兩個不同的拷貝,因爲在那個時候,大量的數據其實完全是一樣的。寫時複製是在推遲真正的數據拷貝。若後來確實發生了寫入,那意味着parent和child的數據不一致了,於是產生複製動作,每個進程拿到屬於自己的那一份,這樣就可以降低系統調用的開銷。所以有了寫時複製後呢,vfork其實現意義就不大了。 

  fork()調用執行一次返回兩個值,對於父進程,fork函數返回子程序的進程號,而對於子程序,fork函數則返回零,這就是一個函數返回兩次的本質。 

  在fork之後,子進程和父進程都會繼續執行fork調用之後的指令。子進程是父進程的副本。它將獲得父進程的數據空間,堆和棧的副本,這些都是副本,父子進程並不共享這部分的內存。也就是說,子進程對父進程中的同名變量進行修改並不會影響其在父進程中的值。但是父子進程又共享一些東西,簡單說來就是程序的正文段。正文段存放着由cpu執行的機器指令,通常是read-only的。下面是一個驗證的例子: 

  例1:fork.c 

  #include 

  #include 

  #include 

  #include 

  int main() 

  { 

  int a = 5; 

  int b = 2; 

  pid_t pid; 

  pid = fork(); 

  if(pid == 0) { 

  a = a-4; 

  printf("I'm a child process with PID [%d],the value of a: %d,thevalue of b:%d.\n",pid,a,b); 

  }else if(pid < 0){ 

  perror("fork"); 

  }else { 

  printf("I'm a parent process, with PID [%d], the value of a: %d,the value of b:%d.\n", pid, a,b); 

  } 

  return 0; 

  } 

  #gcc –o fork fork.c 

  #./fork 

  運行結果: 

  I’m a child process with PID[0],the value of a:1,the value ofb:2. 

  I’m a parent process with PID[19824],the value of a:5,the valueof b:2. 

  可見,子進程中將變量a的值改爲1,而父進程中則保持不變。 

  vfork 

  vfork系統調用不同於fork,用vfork創建的子進程與父進程共享地址空間,也就是說子進程完全運行在父進程的地址空間上,如果這時子進程修改了某個變量,這將影響到父進程。 

  因此,上面的例子如果改用vfork()的話,那麼兩次打印a,b的值是相同的,所在地址也是相同的。 

  但此處有一點要注意的是用vfork()創建的子進程必須顯示調用exit()來結束,否則子進程將不能結束,而fork()則不存在這個情況。 

  Vfork也是在父進程中返回子進程的進程號,在子進程中返回0。 

   用vfork創建子進程後,父進程會被阻塞直到子進程調用exec(exec,將一個新的可執行文件載入到地址空間並執行之。)或exit。vfork的好處是在子進程被創建後往往僅僅是爲了調用exec執行另一個程序,因爲它就不會對父進程的地址空間有任何引用,所以對地址空間的複製是多餘的,因此通過vfork共享內存可以減少不必要的開銷。下面這個例子可以驗證子進程調用exec時父進程是否真的已經結束阻塞: 

  例2:execl.c 

  #include 

  #include 

  #include 

  #include 

  #include 

  #include 

  #include 

  int main() 

  { 
  int a = 1; 
  int b = 2; 
  pid_t pid; 
  int status; 
   
    pid =vfork(); 
    if(pid == -1){ 
      perror("Fork failed to creat aprocess"); 
      exit(1); 
      }
    else if(pid ==0) 
      { 
         //sleep(3); 
         if(execl("/bin/example","example",NULL)<0) 
         { 
             perror("Execfailed"); 
             exit(1); 
         } 
         exit(0); 
       // }else //if(pid != wait(&status)){ 
           // perror("ASignal occured before the child exited"); }
    else 
     printf("parent process,the value of a :%d, b:%d,addr of a: %p,b: %p\n",a,b,&a,&b);exit(0); } 

Example.c 
#include 
int main() 

   int a = 1;
   int b = 2;
   sleep(3);
   printf("Child process,thevalue of a is %d,b is %d,the address a %p,b%p\n",a,b,&a,&b); 
   return0; 

#gcc –o execl execl.c #./ execl 運行結果:
Child process ,The value of a is 1,b is 2,the address a0xbfb73d90,b 0xbfb73d8c 

  如果將註釋掉的三行加入程序的話,由於父進程wait()而阻塞,因此即使此時子進程阻塞,父進程也得不到運行,因此運行結果如下: 

  The value of a is 1,b is 2,the address a 0xbfb73d90,b0xbfb73d8c 

  Parent process,the value of a:1,b:2,addr ofa:0xbfaa710c, b:0xbfaa7108 

  另外還應注意的是在它調用exec後父進程纔可能調度運行,因此sleep(3)函數必須放在example程序中才能生效。 

  clone 

  系統調用fork()和vfork()是無參數的,而clone()則帶有參數。fork()是全部複製,vfork()是共享內存,而clone()是則可以將父進程資源有選擇地複製給子進程,而沒有複製的數據結構則通過指針的複製讓子進程共享,具體要複製哪些資源給子進程,由參數列表中的clone_flags來決定。另外,clone()返回的是子進程的pid。下面來看一個例子: 

  例3:clone.c 

  #include  

  #include  

  #include  

  #include  

  #include  

  #include  

  #include  

  int variable,fd; 

  int do_something() { 

  variable = 42; 

  printf("in child process\n"); 

  close(fd); 

  // _exit(0); 

  return 0; 

  } 

  int main(int argc, char *argv[]){ 

  void *child_stack; 

  char tempch; 

  variable = 9; 

  fd =open("/test.txt",O_RDONLY); 

  child_stack = (void*)malloc(16384); 

  printf("The variable was%d\n",variable); 

  clone(do_something, child_stack+10000, CLONE_VM|CLONE_FILES,NULL); 

  sleep(3);  

  printf("The variable is now%d\n",variable); 

  if(read(fd,&tempch,1) < 1){ 

  perror("File Read Error"); 

  exit(1); 

  } 

  printf("We could read from thefile\n"); 

  return 0; 

  } 

  #gcc –o clone clone.c 

  #./clone 

  運行結果: 

  the value was 9 

  in child process 

  The variable is now 42 

  File Read Error 

  從程序的輸出結果可以看出: 

  子進程將文件關閉並將變量修改(調用clone時用到的CLONE_VM、CLONE_FILES標誌將使得變量和文件描述符表被共享),父進程隨即就感覺到了,這就是clone的特點。由於此處沒有設置標誌CLONE_VFORK,因此子進程在運行時父進程也不會阻塞,兩者同時運行。 

  總結 

  一、fork 

  1. 調用方法 

  #include  
   #include 
   pid_tfork(void); 
  正確返回:在父進程中返回子進程的進程號,在子進程中返回0 
  錯誤返回:-1 

  2. fork函數調用的用途 

  一個進程希望複製自身,從而父子進程能同時執行不同段的代碼。 

  二、vfork 

  1. 調用方法 

  與fork函數完全相同 

  #include  

  #include  

  pid_t vfork(void); 

  正確返回:在父進程中返回子進程的進程號,在子進程中返回0 

  錯誤返回:-1 

  2. vfork函數調用的用途 

  用vfork創建的進程主要目的是用exec函數執行另外的程序。 

  三、clone 

  1.調用方法 

  #include  

  int clone(int (*fn)(void *), void *child_stack, int flags, void*arg); 

  正確返回:返回所創建進程的PID,函數中的flags標誌用於設置創建子進程時的相關選項,具體含義參看P25 

  錯誤返回:-1 

  2.clone()函數調用的用途 

  用於有選擇地設置父子進程之間需共享的資源 

  四、fork,vfork,clone的區別 

   1.fork出來的子進程是父進程的一個拷貝,即,子進程從父進程得到了數據段和堆棧段的拷貝,這些需要分配新的內存;而對於只讀的代碼段,通常使用共享內存的方式訪問;而vfork則是子進程與父進程共享內存空間,子進程對虛擬地址空間任何數據的修改同樣爲父進程所見;clone則由用戶通過參clone_flags的設置來決定哪些資源共享,哪些資源拷貝。 

   2.fork不對父子進程的執行次序進行任何限制,fork返回後,子進程和父進程都從調用fork函數的下一條語句開始行,但父子進程運行順序是不定的,它取決於內核的調度算法;而在vfork調用中,子進程先運行,父進程掛起,直到子進程調用了exec或exit之後,父子進程的執行次序纔不再有限制;clone中由標誌CLONE_VFORK來決定子進程在執行時父進程是阻塞還是運行,若沒有設置該標誌,則父子進程同時運行,設置了該標誌,則父進程掛起,直到子進程結束爲止。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章