php原理性的一些東西1

php腳本的執行過程（編譯與執行相分離）

php的編譯和執行是分離開的，亦即：先執行完編譯，而後再執行。很多人會說：c++也是如此啊，確實。不過php的這種分離可以給我們提供很多便利，當然不可避免也有很有缺點。

先說一下整個過程：
①php會調用編譯函數zend_compile_file()來進行編譯。這個函數的具體實現其實是包括兩個主要過程的：詞法分析（Lex實現），語法分析（Yacc實現）。當執行完這個函數之後:php腳本的編譯就算結束了。這個函數的輸入是：php腳本文件，而輸出則是op_array.簡單一點說：編譯過程就是把腳本給解析成一條條php虛擬機可以處理的指令，而op_array就是這些指令做成的一個array而已（這很類似一些編譯型語言編譯產生的彙編代碼了，也是一條條的命令）。

②：之後php虛擬機會調用zend_execute()這個函數來執行。該函數的輸入就是上邊編譯階段產生的op_array，在這裏他會解析每條命令並進行處理。由於op命令一共有150左右，所以它需要處理這150中命令。這裏會產生一個很有意思的問題：它是如何處理這150種命令的呢？首先每條命令都是有對應的處理器來進行處理的。所以：虛擬機會依據op_array中各條命令的類型來分發給響應的處理器來進行處理。

這裏有兩個小問題： 1：這裏的處理器是什麼？ 2：如何分發的？

要解答這兩個問題都是要從分發機制上來解釋：php虛擬機分發命令的機制有三種：CALL, SWITCH, 和GOTO這三種類型.php默認是使用CALL方式, 也就是所有的opcode處理器都定義爲函數, 然後供虛擬機調用. 這種方式是傳統的方式, 也一般被認爲是最穩定的方式.而SWITCH方式和GOTO方式則是通過switch和goto來分發opcode到對應的處理邏輯(段)執行的.

那現在來回答上邊兩個問題：

1：處理器其實是處理op命令的邏輯。其可以以函數的形式存在，也可能是以邏輯段的方式存在，這取決於命令的分發方式。

2：分發方式有call,switch和goto三種。哪種效率高呢？其實從上邊解釋已經可以初步瞭解了。switch和goto都是在zend_execute()這個函數中有對應的邏輯段，直接執行就可以了。而call是在zend_execute()這個函數中執行函數調用。明擺着：函數調用效率是最低的，調用一次就得壓棧啊！所以效率上：call是最低的。對於switch和goto：比如要執行第三種命令的處理：switch還要先挨個判斷是不是前兩種，而goto根本不需要判斷，直接跳到第三種命令的邏輯代碼段去執行，這比switch少了順序從上到下判斷的損耗，所以：goto效率又比switch要高。所以這三種分發方式總體而言：goto > switch > call

題外話：由於php默認是call，如果你想進一步榨乾php的效能，可以更改下其命令分發方式爲goto。不過用goto方式雖然提高了執行速度，但是編譯速度上其實最慢的喔。

————————————————

再說一下php這種編譯和執行分離的弱點：

其實也不能算是弱點，雖然zend engine(php的虛擬機)將編譯和執行嚴格分開，但是對於用戶而言：就跟沒分開一樣，因爲我每次執行一個php腳本請求都是要執行：編譯->執行這兩個階段。任何一個階段都少不了。那麼這一點我們可以拿來和c++這種編譯型語言做一下對比：同一個請求運行100遍

①對於c++，由於其前期只要編譯一遍，編譯好就不會再重複編譯了，只需要執行就ok，所以其損耗爲：

1次編譯 + 100次執行

②對於php，其每次都要編譯+執行，所以其損耗爲：

100次編譯 + 100次執行

顯然:解釋性語言從數量上來看：其消耗是比編譯型語言多的多。說白了就是：php這種編譯和執行相分離並不是真正的分離。而c++那種纔算是真正的分離。

php也早就意識到這個問題了，於是就想了一個辦法來解決這個問題：這個解決方案就是eAccelerator。主要思路如下：

當腳本第一次運行後，以某種方式保存編譯後腳本（裏邊存放的是op_array），在我們規定的緩存有效時間內，當第二次運行該腳本時就不在進行重複性的編譯工作，而是直接調用執行前面保存的編譯後文件，大大提高了程序性能。

這種方式一定程度上提高了php的效率，但不是最終極的方法，最終極的還是改成編譯型語言那種方式好了，吼吼~~~

———————————————–

最後說一下php編譯和執行分離的優點；

這個優點其實是針對程序員而言，對用戶而言沒什麼。因爲這兩個階段的分離，我們可以在這裏做一些我們想做的事情。

比如想做文件加解密，你想把一些php腳本源碼文件加密，讓用戶看不到源碼。同時呢這個加密後的源碼文件又可以被php虛擬機所解析和處理。當然：要實現這個前提是你先想好加解密算法並保證這個是可逆的過程。

現在你對php源碼文件已經加密了，此時你需要定義一下這種加密文件的後綴，假設爲:*.buaa。那問題就是：我們怎麼讓php虛擬機可以處理這種後綴的文件呢？這就要用到上邊所說的編譯和執行相分離的過程了。

回想一下：編譯階段的輸入是php源文件，輸出是op_array。 ok,我們就在這個階段做文章。主要思路爲：首先在zend_compile_file()這個編譯函數中：看一下輸入文件的後綴：如果是正常的.php那就走正常邏輯，如果是*.buaa，那就先解密然後再走正常邏輯。。。

哈~就是這麼簡單。當然:這個過程沒有所說的這麼簡單，而且你也不可能直接修改zend_compile_file()函數，最後是自己擴展實現一個模塊來處理這個過程。

本文參考瞭如下博文：
1：http://www.laruence.com/2008/08/14/250.html
2：http://yanbin.org/archive/zend-engines-fantasy.html
3：http://www.laruence.com/2008/06/18/221.html
4：http://www.laruence.com/2009/10/15/1131.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

php原理性的一些東西1

php腳本的執行過程（編譯與執行相分離）

容器中nginx無法使用同一個網絡下的容器域名

Python: SunMoonTimeCalculator

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

docker使用特定的網絡

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

nodejs學習07——API

避免DbContext同時在多個線程調用

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

Mongodb基礎用法及查詢操作

linux 定時執行相關

svn的一些事2

關於web構架的一些東西1

php程序員學C/C++

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結