非阻塞模式與PHP多進程

非阻塞模式與PHP多進程

程序非阻塞模式,這裏也可以理解成併發。而併發又暫且可以分爲網絡請求併發 和本地併發 。

先說一下網絡請求併發:

理論描述

假設有一個client,程序邏輯是要請求三個不同的server,處理各自的響應。傳統模型當然是順序執行,先發送第一個請求,等待收到響應數據後再發送第二個請求,以此類推。就像是單核CPU,一次只能處理一件事,其他事情被暫時阻塞。而併發模式可以讓三個server同時處理各自請求,這就可以使大量時間複用。
畫個圖更好說明問題:

非阻塞模式與PHP多進程

前者爲阻塞模式,忽略請求響應等時間,總耗時爲700ms;而後者非阻塞模式,由於三個請求可以同時得到處理,總耗時只有300ms。

代碼實現

<?php
echo "Program starts at ". date('h:i:s') . "./n";
$timeout = 3;
$sockets = array(); //socket句柄數組
//一次發起多個請求
$delay = 0;
while ($delay++ < 3)
{
  $sh = stream_socket_client("localhost:80", $errno, $errstr, $timeout,
      STREAM_CLIENT_ASYNC_CONNECT|STREAM_CLIENT_CONNECT);
  /* 這裏需要稍微延遲一下,否則下面fwrite中的socket句柄不一定能真正使用
    這裏應該是PHP的一處bug,查了一下,官方bug早在08年就有人提交了
    我的5.2.8中尚未解決,不知最新的5.3中是否修正
  */
  usleep(10);
  if ($sh) {
    $sockets[] = $sh;
    $http_header = "GET /test.php?n={$delay} HTTP/1.0/r/n";
    $http_header .= "Host: localhost/r/n";
    $http_header .= "Accept: */*/r/n";
    $http_header .= "Accept-Charset: */r/n";
    $http_header .= "/r/n";
    fwrite($sh, $http_header);
  } else {
    echo "Stream failed to open correctly./n";
  }
}
//非阻塞模式來接收響應
$result = array();
$read_block_size = 8192;
while (count($sockets))
{
  $read = $sockets;
  $n = stream_select($read, $w=null, $e=null, $timeout);
  //if ($n > 0) //據說stream_select返回值不總是可信任的
  if (count($read))
  {
    /* stream_select generally shuffles $read, so we need to
      compute from which socket(s) we're reading. */
    foreach ($read as $r)
    {
      $id = array_search($r, $sockets);
      $data = fread($r, $read_block_size);
      if (strlen($data) == 0)
      {
        echo "Stream {$id} closes at " . date('h:i:s') . "./n";
        fclose($r);
        unset($sockets[$id]);
      } else {
        if (!isset($result[$id])) $result[$id] = '';
        $result[$id] .= $data;
      }
    }
  } else {
    echo "Time-out!/n";
    break;
  }
}
//print_r($result);

幾點說明:

1、使用stream_socket_client函數鏈接請求服務器和端口(簡便起見這裏使用同一地址localhost)。這裏不受限於http協議,可廣泛用於所有TCP/IP協議。詳細內容請參考手冊。
2、這裏鏈接成功後通過發送各自http頭信息來獲取不同響應(這裏使用網站根目錄下的test.php做服務端)。
3、發送header前需要個微小的延遲,代碼中已經做了註釋。
CLI模式運行結果:

非阻塞模式與PHP多進程

多運行幾次會發現,三次請求結束順序是無序的。該demo太過簡單導致整個過程一秒內已完成,但可以針對三次不同請求做相應延遲,來看出非阻塞時時間複用的效果。

下面再大概說下本地併發與PHP多進程編程與實例

本地併發只能通過語言自己的特性在程序本身實現多任務效果,一般來說現在的語言會通過多線程或多進程的方式來實現。由於PHP不支持多線程,目前只能採用多進程方式,讓操作系統來幫助實現本地併發。
至於代碼實現,可以通過pcntl擴展(封裝fork等進程控制函數,和C語言中使用非常相似,windows下不可用)、 proc_open、popen等方式,方法不止一種,

場景:日常任務中,有時需要通過php腳本執行一些日誌分析,隊列處理等任務,當數據量比較大時,可以使用多進程來處理。
準備:php多進程需要pcntl,posix擴展支持,可以通過 php - m 查看,沒安裝的話需要重新編譯php,加上參數--enable-pcntl,posix一般默認會有。

創建子進程的函數fork

pcntl_fork — 在當前進程當前位置產生分支(子進程)。譯註:fork是創建了一個子進程,父進程和子進程 都從fork的位置開始向下繼續執行,不同的是父進程執行過程中,得到的fork返回值爲子進程號,而子進程得到的是0。
一個fork子進程的基礎示例:

<?php
$pid = pcntl_fork();//父進程和子進程都會執行下面代碼
if ($pid == -1) {   
     //錯誤處理:創建子進程失敗時返回-1.
     die('could not fork');
} else if ($pid) {
   //父進程會得到子進程號,所以這裏是父進程執行的邏輯
     pcntl_wait($status); 
    //等待子進程中斷,防止子進程成爲殭屍進程。
} else {     
 //子進程得到的$pid爲0, 所以這裏是子進程執行的邏輯。
}

如果一個任務被分解成多個進程執行,就會減少整體的耗時。
比如有一個比較大的數據文件要處理,這個文件由很多行組成。如果單進程執行要處理的任務,量很大時要耗時比較久。這時可以考慮多進程。
多進程處理分解任務,每個進程處理文件的一部分,這樣需要均分割一下這個大文件成多個小文件(進程數和小文件的個數等同就可以)。
比如該文件file.log有10萬行數據,現在想分4個進程處理。需要分割2.5萬行一個文件。命令split可以做到。
split的用法比較簡單,可以man split查看下手冊。

split -l 25000 -d file.log prefix_name

-l是按照行分割,-d是分割後的文件名按照數字,-a是分割後的文件個數位數(默認是2,做多就是99個;比如超過100個,-a可以寫3)。自己嘗試分割一下就知道了。

處理代碼:

<?php
shell_exec('split -l 25000 -d file.log prefix_name');
// 3個子進程處理任務
for ($i = 0; $i < 3; $i++){   
 $pid = pcntl_fork();    
 if ($pid == -1) {
    die("could not fork");
} elseif ($pid) { 
     echo "I'm the Parent $i\n";
 } else {// 子進程處理
  $content = file_get_contents("prefix_name0".$i); 
// 業務處理 begin
// 業務處理 end
    exit;
// 一定要注意退出子進程,否則pcntl_fork() 會被子進程再fork,帶來處理上的影響。    }
}// 等待子進程執行結束
while (pcntl_waitpid(0, $status) != -1) {    
$status = pcntl_wexitstatus($status);    
echo "Child $status completed\n";}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章