php的autoload機制的實現解析

在使用PHP的OO模式開發系統時,通常大家習慣上將每個類的實現都存放在一個單獨的文件裏,這樣會很容易實現對類進行復用,同時將來維護時也很便利 

一、autoload機制概述 


在使用PHP的OO模式開發系統時,通常大家習慣上將每個類的實現都存放在一個單獨的文件裏,這樣會很容易實現對類進行復用,同時將來維護時也很便利。這也是OO設計的基本思想之一。在PHP5之前,如果需要使用一個類,只需要直接使用include/require將其包含進來即可。 
下面是一個實際的例子: 

/* Person.class.php */ 
<?php 
class Person { 
var $name, $age; 
function __construct ($name, $age) 

$this->name = $name; 
$this->age = $age; 


?> 
/* no_autoload.php */ 
<?php 
require_once ("Person.class.php"); 
$person = new Person("Altair", 6); 
var_dump ($person); 


在這個例子中,no-autoload.php文件需要使用Person類,它使用了require_once將其包含,然後就可以直接使用Person類來實例化一個對象。 
但隨着項目規模的不斷擴大,使用這種方式會帶來一些隱含的問題:如果一個PHP文件需要使用很多其它類,那麼就需要很多的require/include語句,這樣有可能會造成遺漏或者包含進不必要的類文件。如果大量的文件都需要使用其它的類,那麼要保證每個文件都包含正確的類文件肯定是一個噩夢。 
PHP5爲這個問題提供了一個解決方案,這就是類的自動裝載(autoload)機制。autoload機制可以使得PHP程序有可能在使用類時才自動包含類文件,而不是一開始就將所有的類文件include進來,這種機制也稱爲lazy loading。 

下面是使用autoload機制加載Person類的例子: 

/* autoload.php */ 
<?php 
function __autoload($classname) { 
require_once ($classname . "class.php"); 

$person = new Person("Altair", 6); 
var_dump ($person); 
?> 


通常PHP5在使用一個類時,如果發現這個類沒有加載,就會自動運行__autoload()函數,在這個函數中我們可以加載需要使用的類。在我們這個簡單的例子中,我們直接將類名加上擴展名”.class.php”構成了類文件名,然後使用require_once將其加載。從這個例子中,我們可以看出autoload至少要做三件事情,第一件事是根據類名確定類文件名,第二件事是確定類文件所在的磁盤路徑(在我們的例子是最簡單的情況,類與調用它們的PHP程序文件在同一個文件夾下),第三件事是將類從磁盤文件中加載到系統中。第三步最簡單,只需要使用include/require即可。要實現第一步,第二步的功能,必須在開發時約定類名與磁盤文件的映射方法,只有這樣我們才能根據類名找到它對應的磁盤文件。 

因此,當有大量的類文件要包含的時候,我們只要確定相應的規則,然後在__autoload()函數中,將類名與實際的磁盤文件對應起來,就可以實現lazy loading的效果。從這裏我們也可以看出__autoload()函數的實現中最重要的是類名與實際的磁盤文件映射規則的實現。 

但現在問題來了,如果在一個系統的實現中,如果需要使用很多其它的類庫,這些類庫可能是由不同的開發人員編寫的,其類名與實際的磁盤文件的映射規則不盡相同。這時如果要實現類庫文件的自動加載,就必須在__autoload()函數中將所有的映射規則全部實現,這樣的話__autoload()函數有可能會非常複雜,甚至無法實現。最後可能會導致__autoload()函數十分臃腫,這時即便能夠實現,也會給將來的維護和系統效率帶來很大的負面影響。在這種情況下,難道就沒有更簡單清晰的解決辦法了吧?答案當然是:NO! 在看進一步的解決方法之前,我們先來看一下PHP中的autoload機制是如何實現的。 

二、PHP的autoload機制的實現 

我們知道,PHP文件的執行分爲兩個獨立的過程,第一步是將PHP文件編譯成普通稱之爲OPCODE的字節碼序列(實際上是編譯成一個叫做zend_op_array的字節數組),第二步是由一個虛擬機來執行這些OPCODE。PHP的所有行爲都是由這些OPCODE來實現的。因此,爲了研究PHP中autoload的實現機制,我們將autoload.php文件編譯成opcode,然後根據這些OPCODE來研究PHP在這過程中都做了些什麼: 
複製代碼 代碼如下: 
/* autoload.php 編譯後的OPCODE列表,是使用作者開發的OPDUMP工具 
* 生成的結果,可以到網站 http://www.phpinternals.com/ 下載該軟件。 
*/ 
<?php 
// require_once ("Person.php"); 

function __autoload ($classname) { 
0 NOP 
0 RECV 1 
if (!class_exists($classname)) { 
1 SEND_VAR !0 
2 DO_FCALL 'class_exists' [extval:1] 
3 BOOL_NOT $0 =>RES[~1] 
4 JMPZ ~1, ->8 
require_once ($classname. ".class.php"); 
5 CONCAT !0, '.class.php' =>RES[~2] 
6 INCLUDE_OR_EVAL ~2, REQUIRE_ONCE 

7 JMP ->8 

8 RETURN null 

$p = new Person('Fred', 35); 
1 FETCH_CLASS 'Person' =>RES[:0] 
2 NEW :0 =>RES[$1] 
3 SEND_VAL 'Fred' 
4 SEND_VAL 35 
5 DO_FCALL_BY_NAME [extval:2] 
6 ASSIGN !0, $1 

var_dump ($p); 
7 SEND_VAR !0 
8 DO_FCALL 'var_dump' [extval:1] 
?> 


在autoload.php的第10行代碼中我們需要爲類Person實例化一個對象。因此autoload機制一定會在該行編譯後的opcode中有所體現。從上面的第10行代碼生成的OPCODE中我們知道,在實例化對象Person時,首先要執行FETCH_CLASS指令。我們就從PHP對FETCH_CLASS指令的處理過程開始我們的探索之旅。 

通過查閱PHP的源代碼(我使用的是PHP 5.3alpha2版本)可以發現如下的調用序列: 

ZEND_VM_HANDLER(109, ZEND_FETCH_CLASS, ...) (zend_vm_def.h 1864行) 
=> zend_fetch_class (zend_execute_API.c 1434行) 
=>zend_lookup_class_ex (zend_execute_API.c 964行) 
=> zend_call_function(&fcall_info, &fcall_cache) (zend_execute_API.c 1040行) 

在最後一步的調用之前,我們先看一下調用時的關鍵參數: 
複製代碼 代碼如下: 
/* 設置autoload_function變量值爲"__autoload" */ 
fcall_info.function_name = &autoload_function; // Ooops, 終於發現"__autoload"了 
... 
fcall_cache.function_handler = EG(autoload_func); // autoload_func ! 

zend_call_function是Zend Engine中最重要的函數之一,其主要功能是執行用戶在PHP程序中自定義的函數或者PHP本身的庫函數。zend_call_function有兩個重要的指針形參數fcall_info, fcall_cache,它們分別指向兩個重要的結構,一個是zend_fcall_info, 另一個是zend_fcall_info_cache。zend_call_function主要工作流程如下:如果fcall_cache.function_handler指針爲NULL,則嘗試查找函數名爲fcall_info.function_name的函數,如果存在的話,則執行之;如果fcall_cache.function_handler不爲NULL,則直接執行fcall_cache.function_handler指向的函數。 

現在我們清楚了,PHP在實例化一個對象時(實際上在實現接口,使用類常數或類中的靜態變量,調用類中的靜態方法時都會如此),首先會在系統中查找該類(或接口)是否存在,如果不存在的話就嘗試使用autoload機制來加載該類。而autoload機制的主要執行過程爲: 

(1) 檢查執行器全局變量函數指針autoload_func是否爲NULL。 
(2) 如果autoload_func==NULL, 則查找系統中是否定義有__autoload()函數,如果沒有,則報告錯誤並退出。 
(3) 如果定義了__autoload()函數,則執行__autoload()嘗試加載類,並返回加載結果。 
(4) 如果autoload_func不爲NULL,則直接執行autoload_func指針指向的函數用來加載類。注意此時並不檢查__autoload()函數是否定義。 
真相終於大白,PHP提供了兩種方法來實現自動裝載機制,一種我們前面已經提到過,是使用用戶定義的__autoload()函數,這通常在PHP源程序中來實現;另外一種就是設計一個函數,將autoload_func指針指向它,這通常使用C語言在PHP擴展中實現。如果既實現了__autoload()函數,又實現了autoload_func(將autoload_func指向某一PHP函數),那麼只執行autoload_func函數。 

三、SPL autoload機制的實現 
SPL是Standard PHP Library(標準PHP庫)的縮寫。它是PHP5引入的一個擴展庫,其主要功能包括autoload機制的實現及包括各種Iterator接口或類。SPL autoload機制的實現是通過將函數指針autoload_func指向自己實現的具有自動裝載功能的函數來實現的。SPL有兩個不同的函數spl_autoload, spl_autoload_call,通過將autoload_func指向這兩個不同的函數地址來實現不同的自動加載機制。 
spl_autoload是SPL實現的默認的自動加載函數,它的功能比較簡單。它可以接收兩個參數,第一個參數是$class_name,表示類名,第二個參數$file_extensions是可選的,表示類文件的擴展名,可以在$file_extensions中指定多個擴展名,護展名之間用分號隔開即可;如果不指定的話,它將使用默認的擴展名.inc或.php。spl_autoload首先將$class_name變爲小寫,然後在所有的include path中搜索$class_name.inc或$class_name.php文件(如果不指定$file_extensions參數的話),如果找到,就加載該類文件。你可以手動使用spl_autoload(“Person”, “.class.php”)來加載Person類。實際上,它跟require/include差不多,不同的它可以指定多個擴展名。 

怎樣讓spl_autoload自動起作用呢,也就是將autoload_func指向spl_autoload?答案是使用spl_autoload_register函數。在PHP腳本中第一次調用spl_autoload_register()時不使用任何參數,就可以將autoload_func指向spl_autoload。 

通過上面的說明我們知道,spl_autoload的功能比較簡單,而且它是在SPL擴展中實現的,我們無法擴充它的功能。如果想實現自己的更靈活的自動加載機制怎麼辦呢?這時,spl_autoload_call函數閃亮登場了。 

我們先看一下spl_autoload_call的實現有何奇妙之處。在SPL模塊內部,有一個全局變量autoload_functions,它本質上是一個HashTable,不過我們可以將其簡單的看作一個鏈表,鏈表中的每一個元素都是一個函數指針,指向一個具有自動加載類功能的函數。spl_autoload_call本身的實現很簡單,只是簡單的按順序執行這個鏈表中每個函數,在每個函數執行完成後都判斷一次需要的類是否已經加載,如果加載成功就直接返回,不再繼續執行鏈表中的其它函數。如果這個鏈表中所有的函數都執行完成後類還沒有加載,spl_autoload_call就直接退出,並不向用戶報告錯誤。因此,使用了autoload機制,並不能保證類就一定能正確的自動加載,關鍵還是要看你的自動加載函數如何實現。 

那麼自動加載函數鏈表autoload_functions是誰來維護呢?就是前面提到的spl_autoload_register函數。它可以將用戶定義的自動加載函數註冊到這個鏈表中,並將autoload_func函數指針指向spl_autoload_call函數(注意有一種情況例外,具體是哪種情況留給大家思考)。我們也可以通過spl_autoload_unregister函數將已經註冊的函數從autoload_functions鏈表中刪除。 

上節說過,當autoload_func指針非空時,就不會自動執行__autoload()函數了,現在autoload_func已經指向了spl_autoload_call,如果我們還想讓__autoload()函數起作用應該怎麼辦呢?當然還是使用spl_autoload_register(__autoload)調用將它註冊到autoload_functions鏈表中。 

現在回到第一節最後的問題,我們有了解決方案:根據每個類庫不同的命名機制實現各自的自動加載函數,然後使用spl_autoload_register分別將其註冊到SPL自動加載函數隊列中就可了。這樣我們就不用維護一個非常複雜的__autoload函數了。 

四、autoload效率問題及對策 

使用autoload機制時,很多人的第一反應就是使用autoload會降低系統效率,甚至有人乾脆提議爲了效率不要使用autoload。在我們瞭解了autoload實現的原理後,我們知道autoload機制本身並不是影響系統效率的原因,甚至它還有可能提高系統效率,因爲它不會將不需要的類加載到系統中。 

那麼爲什麼很多人都有一個使用autoload會降低系統效率的印象呢?實際上,影響autoload機制效率本身恰恰是用戶設計的自動加載函數。如果它不能高效的將類名與實際的磁盤文件(注意,這裏指實際的磁盤文件,而不僅僅是文件名)對應起來,系統將不得不做大量的文件是否存在(需要在每個include path中包含的路徑中去尋找)的判斷,而判斷文件是否存在需要做磁盤I/O操作,衆所周知磁盤I/O操作的效率很低,因此這纔是使得autoload機制效率降低的罪魁禍首! 

因此,我們在系統設計時,需要定義一套清晰的將類名與實際磁盤文件映射的機制。這個規則越簡單越明確,autoload機制的效率就越高。autoload機制並不是天然的效率低下,只有濫用autoload,設計不好的自動裝載函數纔會導致其效率的降低。

以上文章轉載自:http://old.uplook.cn/index.php?a=index&m=Index&c=show&id=162291&#top

以下爲本人總結

五、總結

其實PHP自動加載函數有三個:__autoload(魔術方法,需要用戶自己實現),spl_autoload(PHP自己默認實現), spl_autoload_call(調用函數鏈表,查找類)

PHP內部實現中有個叫autoload_func的指針(注意它是指針),

默認情況下autoload_func=NULL,如果autoload_func==NULL,那麼PHP使用__autoload來加載類;如果不爲NULL,則使用autoload_func指針指向的函數實現來加載類。

所以我們可以通過spl_autoload_register(),spl_ autoload_ unregister(),維護autoload_func的指針指向.

spl_autoload_register參數爲空時,autoload_func指向spl_autoload函數(PHP已經實現了個簡單的類文件查找),如果提供其它函數實現,則將其添加到一張函數鏈表中,當加載類時PHP會調用spl_autoload_call按鏈表依次查找。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章