程序非阻塞模式,這裏也可以理解成併發。而併發又暫且可以分爲網絡請求併發 和本地併發 。
先說一下網絡請求併發:
理論描述
假設有一個client,程序邏輯是要請求三個不同的server,處理各自的響應。傳統模型當然是順序執行,先發送第一個請求,等待收到響應數據後再發送第二個請求,以此類推。就像是單核CPU,一次只能處理一件事,其他事情被暫時阻塞。而併發模式可以讓三個server同時處理各自請求,這就可以使大量時間複用。
畫個圖更好說明問題:
前者爲阻塞模式,忽略請求響應等時間,總耗時爲700ms;而後者非阻塞模式,由於三個請求可以同時得到處理,總耗時只有300ms。
代碼實現
<?php
echo "Program starts at ". date('h:i:s') . "./n";
$timeout = 3;
$sockets = array(); //socket句柄數組
//一次發起多個請求
$delay = 0;
while ($delay++ < 3)
{
$sh = stream_socket_client("localhost:80", $errno, $errstr, $timeout,
STREAM_CLIENT_ASYNC_CONNECT|STREAM_CLIENT_CONNECT);
/* 這裏需要稍微延遲一下,否則下面fwrite中的socket句柄不一定能真正使用
這裏應該是PHP的一處bug,查了一下,官方bug早在08年就有人提交了
我的5.2.8中尚未解決,不知最新的5.3中是否修正
*/
usleep(10);
if ($sh) {
$sockets[] = $sh;
$http_header = "GET /test.php?n={$delay} HTTP/1.0/r/n";
$http_header .= "Host: localhost/r/n";
$http_header .= "Accept: */*/r/n";
$http_header .= "Accept-Charset: */r/n";
$http_header .= "/r/n";
fwrite($sh, $http_header);
} else {
echo "Stream failed to open correctly./n";
}
}
//非阻塞模式來接收響應
$result = array();
$read_block_size = 8192;
while (count($sockets))
{
$read = $sockets;
$n = stream_select($read, $w=null, $e=null, $timeout);
//if ($n > 0) //據說stream_select返回值不總是可信任的
if (count($read))
{
/* stream_select generally shuffles $read, so we need to
compute from which socket(s) we're reading. */
foreach ($read as $r)
{
$id = array_search($r, $sockets);
$data = fread($r, $read_block_size);
if (strlen($data) == 0)
{
echo "Stream {$id} closes at " . date('h:i:s') . "./n";
fclose($r);
unset($sockets[$id]);
} else {
if (!isset($result[$id])) $result[$id] = '';
$result[$id] .= $data;
}
}
} else {
echo "Time-out!/n";
break;
}
}
//print_r($result);
幾點說明:
1、使用stream_socket_client函數鏈接請求服務器和端口(簡便起見這裏使用同一地址localhost)。這裏不受限於http協議,可廣泛用於所有TCP/IP協議。詳細內容請參考手冊。
2、這裏鏈接成功後通過發送各自http頭信息來獲取不同響應(這裏使用網站根目錄下的test.php做服務端)。
3、發送header前需要個微小的延遲,代碼中已經做了註釋。
CLI模式運行結果:
多運行幾次會發現,三次請求結束順序是無序的。該demo太過簡單導致整個過程一秒內已完成,但可以針對三次不同請求做相應延遲,來看出非阻塞時時間複用的效果。
下面再大概說下本地併發與PHP多進程編程與實例
本地併發只能通過語言自己的特性在程序本身實現多任務效果,一般來說現在的語言會通過多線程或多進程的方式來實現。由於PHP不支持多線程,目前只能採用多進程方式,讓操作系統來幫助實現本地併發。
至於代碼實現,可以通過pcntl擴展(封裝fork等進程控制函數,和C語言中使用非常相似,windows下不可用)、 proc_open、popen等方式,方法不止一種,
場景:日常任務中,有時需要通過php腳本執行一些日誌分析,隊列處理等任務,當數據量比較大時,可以使用多進程來處理。
準備:php多進程需要pcntl,posix擴展支持,可以通過 php - m 查看,沒安裝的話需要重新編譯php,加上參數--enable-pcntl,posix一般默認會有。
創建子進程的函數fork
pcntl_fork — 在當前進程當前位置產生分支(子進程)。譯註:fork是創建了一個子進程,父進程和子進程 都從fork的位置開始向下繼續執行,不同的是父進程執行過程中,得到的fork返回值爲子進程號,而子進程得到的是0。
一個fork子進程的基礎示例:
<?php
$pid = pcntl_fork();//父進程和子進程都會執行下面代碼
if ($pid == -1) {
//錯誤處理:創建子進程失敗時返回-1.
die('could not fork');
} else if ($pid) {
//父進程會得到子進程號,所以這裏是父進程執行的邏輯
pcntl_wait($status);
//等待子進程中斷,防止子進程成爲殭屍進程。
} else {
//子進程得到的$pid爲0, 所以這裏是子進程執行的邏輯。
}
如果一個任務被分解成多個進程執行,就會減少整體的耗時。
比如有一個比較大的數據文件要處理,這個文件由很多行組成。如果單進程執行要處理的任務,量很大時要耗時比較久。這時可以考慮多進程。
多進程處理分解任務,每個進程處理文件的一部分,這樣需要均分割一下這個大文件成多個小文件(進程數和小文件的個數等同就可以)。
比如該文件file.log有10萬行數據,現在想分4個進程處理。需要分割2.5萬行一個文件。命令split可以做到。
split的用法比較簡單,可以man split查看下手冊。
split -l 25000 -d file.log prefix_name
-l是按照行分割,-d是分割後的文件名按照數字,-a是分割後的文件個數位數(默認是2,做多就是99個;比如超過100個,-a可以寫3)。自己嘗試分割一下就知道了。
處理代碼:
<?php
shell_exec('split -l 25000 -d file.log prefix_name');
// 3個子進程處理任務
for ($i = 0; $i < 3; $i++){
$pid = pcntl_fork();
if ($pid == -1) {
die("could not fork");
} elseif ($pid) {
echo "I'm the Parent $i\n";
} else {// 子進程處理
$content = file_get_contents("prefix_name0".$i);
// 業務處理 begin
// 業務處理 end
exit;
// 一定要注意退出子進程,否則pcntl_fork() 會被子進程再fork,帶來處理上的影響。 }
}// 等待子進程執行結束
while (pcntl_waitpid(0, $status) != -1) {
$status = pcntl_wexitstatus($status);
echo "Child $status completed\n";}