php原理性的一些東西1

php腳本的執行過程(編譯與執行相分離)


php的編譯和執行是分離開的,亦即:先執行完編譯,而後再執行。很多人會說:c++也是如此啊,確實。不過php的這種分離可以給我們提供很多便利,當然不可避免也有很有缺點。

先說一下整個過程:
①php會調用編譯函數zend_compile_file()來進行編譯。 這個函數的具體實現其實是包括兩個主要過程的:詞法分析(Lex實現),語法分析(Yacc實現)。當執行完這個函數之後:php腳本的編譯就算結束了。 這個函數的輸入是:php腳本文件,而輸出則是op_array.簡單一點說:編譯過程就是把腳本給解析成一條條php虛擬機可以處理的指令,而op_array就是這些指令做成的一個array而已(這很類似一些編譯型語言編譯產生的彙編代碼了,也是一條條的命令)。

②:之後php虛擬機會調用zend_execute()這個函數來執行。該函數的輸入就是上邊編譯階段產生的op_array,在這裏他會解析每條命令並進行處理。 由於op命令一共有150左右,所以它需要處理這150中命令。這裏會產生一個很有意思的問題:它是如何處理這150種命令的呢?首先每條命令都是有對應的處理器來進行處理的。所以:虛擬機會依據op_array中各條命令的類型來分發給響應的處理器來進行處理。

這裏有兩個小問題: 1:這裏的處理器是什麼?  2:如何分發的?

要解答這兩個問題都是要從分發機制上來解釋:php虛擬機分發命令的機制有三種:CALL, SWITCH, 和GOTO這三種類型.php默認是使用CALL方式, 也就是所有的opcode處理器都定義爲函數, 然後供虛擬機調用. 這種方式是傳統的方式, 也一般被認爲是最穩定的方式.而SWITCH方式和GOTO方式則是通過switch和goto來分發opcode到對應的處理邏輯(段)執行的.

那現在來回答上邊兩個問題:

1:處理器其實是處理op命令的邏輯。其可以以函數的形式存在,也可能是以邏輯段的方式存在,這取決於命令的分發方式。

2:分發方式有call,switch和goto三種。哪種效率高呢?其實從上邊解釋已經可以初步瞭解了。switch和goto都是在zend_execute()這個函數中有對應的邏輯段,直接執行就可以了。而call是在zend_execute()這個函數中執行函數調用。明擺着:函數調用效率是最低的,調用一次就得壓棧啊!所以效率上:call是最低的。對於switch和goto:比如要執行第三種命令的處理:switch還要先挨個判斷是不是前兩種,而goto根本不需要判斷,直接跳到第三種命令的邏輯代碼段去執行,這比switch少了順序從上到下判斷的損耗,所以:goto效率又比switch要高。  所以這三種分發方式總體而言:goto > switch > call

題外話:由於php默認是call,如果你想進一步榨乾php的效能,可以更改下其命令分發方式爲goto。不過用goto方式雖然提高了執行速度,但是編譯速度上其實最慢的喔。

————————————————

再說一下php這種編譯和執行分離的弱點:

其實也不能算是弱點,雖然zend engine(php的虛擬機)將編譯和執行嚴格分開,但是對於用戶而言:就跟沒分開一樣,因爲我每次執行一個php腳本請求都是要執行:編譯->執行  這兩個階段。任何一個階段都少不了。那麼這一點我們可以拿來和c++這種編譯型語言做一下對比: 同一個請求運行100遍

①對於c++,由於其前期只要編譯一遍,編譯好就不會再重複編譯了,只需要執行就ok,所以其損耗爲:

1次編譯 + 100次執行

②對於php,其每次都要編譯+執行,所以其損耗爲:

100次編譯 + 100次執行

顯然:解釋性語言從數量上來看:其消耗是比編譯型語言多的多。說白了就是:php這種編譯和執行相分離並不是真正的分離。而c++那種纔算是真正的分離。

php也早就意識到這個問題了,於是就想了一個辦法來解決這個問題:這個解決方案就是eAccelerator。主要思路如下:

當腳本第一次運行後,以某種方式保存編譯後腳本(裏邊存放的是op_array),在我們規定的緩存有效時間內,當第二次運行該腳本時就不在進行重複性的編譯工作,而是直接調用執行前面保存的編譯後文件,大大提高了程序性能。

這種方式一定程度上提高了php的效率,但不是最終極的方法,最終極的還是改成編譯型語言那種方式好了,吼吼~~~

———————————————–

最後說一下php編譯和執行分離的優點;

這個優點其實是針對程序員而言,對用戶而言沒什麼。因爲這兩個階段的分離,我們可以在這裏做一些我們想做的事情。

比如想做文件加解密,你想把一些php腳本源碼文件加密,讓用戶看不到源碼。同時呢這個加密後的源碼文件又可以被php虛擬機所解析和處理。當然:要實現這個前提是你先想好加解密算法並保證這個是可逆的過程。

現在你對php源碼文件已經加密了,此時你需要定義一下這種加密文件的後綴,假設爲:*.buaa。 那問題就是:我們怎麼讓php虛擬機可以處理這種後綴的文件呢?這就要用到上邊所說的編譯和執行相分離的過程了。

回想一下:編譯階段的輸入是php源文件,輸出是op_array。 ok,我們就在這個階段做文章。主要思路爲:首先在zend_compile_file()這個編譯函數中:看一下輸入文件的後綴:如果是正常的.php那就走正常邏輯,如果是*.buaa,那就先解密然後再走正常邏輯。。。

哈~就是這麼簡單。當然:這個過程沒有所說的這麼簡單,而且你也不可能直接修改zend_compile_file()函數,最後是自己擴展實現一個模塊來處理這個過程。

本文參考瞭如下博文:
1:http://www.laruence.com/2008/08/14/250.html
2:http://yanbin.org/archive/zend-engines-fantasy.html
3:http://www.laruence.com/2008/06/18/221.html
4:http://www.laruence.com/2009/10/15/1131.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章