PHP內核研究:HASH表和變量

PHP HASH表

 

在PHP中,所有的數據 無論變量,常量,類,屬性 都用Hash表來實現.

先要說說 HASH表

 

  1. typedef struct bucket { 
  2.         ulong h;                                                /* Used for numeric indexing */ 
  3.         uint nKeyLength; //key長度 
  4.         void *pData; //指向 Bucke保存的數據 指針 
  5.         void *pDataPtr; //指針數據 
  6.         struct bucket *pListNext; //下一個元素指針 
  7.         struct bucket *pListLast;//上一個元素指針 
  8.         struct bucket *pNext; 
  9.         struct bucket *pLast; 
  10.         char arKey[1]; /* Must be last element */ 
  11. } Bucket; 
  12. typedef struct _hashtable { 
  13.         uint nTableSize;//HashTable的大小 
  14.         uint nTableMask;//等於nTableSize-1 
  15.         uint nNumOfElements;//對象個數 
  16.         ulong nNextFreeElement;//指向下一個空元素位置 nTableSize+1 
  17.         Bucket *pInternalPointer;       /* Used for element traversal *///保存當前遍歷的指針 
  18.         Bucket *pListHead;//頭元素指針 
  19.         Bucket *pListTail;//尾元素指針 
  20.         Bucket **arBuckets;//存儲hash數組數據 
  21.         dtor_func_t pDestructor;//類似於析構函數 
  22.         zend_bool persistent;//用哪種方法分配內存空間 PHP統一管理內存還是用普通的malloc 
  23.         unsigned char nApplyCount;//當前hash bucket被訪問的次數,是否遍歷過數據,防止無限遞歸循環 
  24.         zend_bool bApplyProtection; 
  25. #if ZEND_DEBUG 
  26.         int inconsistent; 
  27. #endif 
  28. } HashTable; 

我們結合 HASH表初始化函數來說

 

  1. ZEND_API int _zend_hash_init(HashTable *ht, uint nSize, hash_func_t pHashFunction, dtor_func_t pDestructor, zend_bool persistent ZEND_FILE_LINE_DC) 
  2.  uint i = 3; 
  3.  Bucket **tmp; 
  4.   
  5. SET_INCONSISTENT(HT_OK); 
  6.   
  7.  if (nSize >= 0x80000000) { //HASH表大小大於0x8則初始化爲0x8 
  8.        /* prevent overflow */ 
  9.        ht->nTableSize = 0x80000000; 
  10.  } else { 
  11.        while ((1U << i) < nSize) { //調整爲 2的n次方          i++;        }        ht->nTableSize = 1 << i;//HASH bucket大小   爲 2的i次方  i=3 ,nTableSize最小值爲8 
  12.  } 
  13. //爲了提高計算效率,系統自動會將nTableSize調整到最小一個不小於nTableSize的2的整數次方。也就是說,如果在初始化HashTable時指定一個nTableSize不是2的整數次方,系統將會自動調整nTableSize的值 <!--EndFragment--> 
  14.   
  15.  ht->nTableMask = ht->nTableSize - 1; 
  16.  ht->pDestructor = pDestructor;//一個函數指針,當HashTable發生增,刪,改時調用 
  17.  ht->arBuckets = NULL; 
  18.  ht->pListHead = NULL; 
  19.  ht->pListTail = NULL; 
  20.  ht->nNumOfElements = 0; 
  21.  ht->nNextFreeElement = 0; 
  22.  ht->pInternalPointer = NULL; 
  23.  ht->persistent = persistent;//如果persisient爲TRUE,則使用操作系統本身的內存分配函數爲Bucket分配內存,否則使用PHP的內存分配函數 
  24.  ht->nApplyCount = 0; 
  25.  ht->bApplyProtection = 1; 
  26.   
  27.  /* Uses ecalloc() so that Bucket* == NULL */ 
  28.  if (persistent) {  //操作系統本身內存分配方式分配內存,calloc分配內存後自動初始化爲0 
  29.  tmp = (Bucket **) calloc(ht->nTableSize, sizeof(Bucket *)); 
  30.  if (!tmp) { 
  31.  return FAILURE; 
  32.  } 
  33.  ht->arBuckets = tmp; 
  34.  } else {//用PHP的內存管理機制分配內存 
  35.  tmp = (Bucket **) ecalloc_rel(ht->nTableSize, sizeof(Bucket *)); 
  36.  if (tmp) { 
  37.  ht->arBuckets = tmp; 
  38.  } 
  39.  } 
  40. //自動申請一塊內存給arBuckets,該內存大小等於 nTableSize 
  41. return SUCCESS; 

 

    在讀源碼的時候 ,經常會看到 EG,PG,CG這樣的宏

CG是 compile_global的簡寫

EG是excutor_global的簡寫

G就是全局變量的意思

我們就以EG宏爲例

 

  1. #ifdef ZTS 
  2. # define EG(v) TSRMG(executor_globals_id, zend_executor_globals *, v) 
  3. #else 
  4. # define EG(v) (executor_globals.v) 
  5. extern ZEND_API zend_executor_globals executor_globals; 
  6. #endif 

 

很簡單 只是一個獲取全局變量的宏

那麼我們看看 zend_executor_globals這個結構體

在/Zend/zend.h裏面定義

typedef struct _zend_executor_globals zend_executor_globals;

是一個 _zend_executor_globals的別名

同一個文件裏找到它

PHP的所有 局部變量,全局變量,函數,類的 Hash表 都在這裏定義了

 

  1. struct _zend_executor_globals { 
  2. zval **return_value_ptr_ptr; 
  3.   
  4. zval uninitialized_zval; 
  5. zval *uninitialized_zval_ptr; 
  6.   
  7. zval error_zval; 
  8. zval *error_zval_ptr; 
  9.   
  10. zend_ptr_stack arg_types_stack; 
  11.   
  12. /* symbol table cache */ 
  13. HashTable *symtable_cache[SYMTABLE_CACHE_SIZE]; 
  14. HashTable **symtable_cache_limit; 
  15. HashTable **symtable_cache_ptr; 
  16.   
  17. zend_op **opline_ptr; 
  18.   
  19. HashTable *active_symbol_table;  //局部變量 
  20. HashTable symbol_table; /* main symbol table */ //全局變量 
  21.   
  22. HashTable included_files; /* files already included */ //include的文件 
  23.   
  24. JMP_BUF *bailout; 
  25.   
  26. int error_reporting; 
  27. int orig_error_reporting; 
  28. int exit_status; 
  29.   
  30. zend_op_array *active_op_array; 
  31.   
  32. HashTable *function_table; /* function symbol table */ //函數表 
  33. HashTable *class_table; /* class table */ //類表 
  34. HashTable *zend_constants; /* constants table */ //常量表 
  35.   
  36. zend_class_entry *scope; 
  37. zend_class_entry *called_scope; /* Scope of the calling class */ 
  38.   
  39. zval *This; 
  40.   
  41. long precision; 
  42.   
  43. int ticks_count; 
  44.   
  45. zend_bool in_execution; 
  46. HashTable *in_autoload; 
  47. zend_function *autoload_func; 
  48. zend_bool full_tables_cleanup; 
  49.   
  50. /* for extended information support */ 
  51. zend_bool no_extensions; 
  52.   
  53. #ifdef ZEND_WIN32 
  54. zend_bool timed_out; 
  55. OSVERSIONINFOEX windows_version_info; 
  56. #endif 
  57.   
  58. HashTable regular_list; 
  59. HashTable persistent_list; 
  60.   
  61. zend_vm_stack argument_stack; 
  62.   
  63. int user_error_handler_error_reporting; 
  64. zval *user_error_handler; 
  65. zval *user_exception_handler; 
  66. zend_stack user_error_handlers_error_reporting; 
  67. zend_ptr_stack user_error_handlers; 
  68. zend_ptr_stack user_exception_handlers; 
  69.   
  70. zend_error_handling_t error_handling; 
  71. zend_class_entry *exception_class; 
  72.   
  73. /* timeout support */ 
  74. int timeout_seconds; 
  75.   
  76. int lambda_count; 
  77.   
  78. HashTable *ini_directives; 
  79. HashTable *modified_ini_directives; 
  80.   
  81. zend_objects_store objects_store; 
  82. zval *exception, *prev_exception; 
  83. zend_op *opline_before_exception; 
  84. zend_op exception_op[3]; 
  85.   
  86. struct _zend_execute_data *current_execute_data; 
  87.   
  88. struct _zend_module_entry *current_module; 
  89.   
  90. zend_property_info std_property_info; 
  91.   
  92. zend_bool active; 
  93.   
  94. void *saved_fpu_cw; 
  95.   
  96. void *reserved[ZEND_MAX_RESERVED_RESOURCES]; 
  97. }; 

 

 

這裏先簡單看看,以後用到的時候再細說,

  • PHP裏最基本的單元 變量:
    在PHP裏 定義一個變量 再簡單不過了
  1. <?php 
  2. $a=1; 
  3. ?> 

 

但是在內核中 它是用一個 zval結構體實現的
如上面定義變量 在內核中則執行了下面這些代碼

 

  1. zval *val; 
  2. MAKE_STD_ZVAL(val);  //申請一塊內存 
  3. ZVAL_STRING(val,"hello",1);//用ZVAL_STRING設置它的值爲 "hello" 
  4. ZEND_SET_SYMBOL(EG(active_symbol_table),"a",val));//將  val指針加入到符號表裏面去 

宏 MAKE_STD_ZVAL 定義如下

 

  1. #define MAKE_STD_ZVAL(zv)                                \ 
  2. ALLOC_ZVAL(zv); \  //它歸根到底等於 (p) = (type *) emalloc(sizeof(type)) 
  3. INIT_PZVAL(zv); 

INIT_PZVAL定義在

 

  1. #define INIT_PZVAL(z)           \ 看得出它是初始化參數 
  2. (z)->refcount__gc = 1;  \ 
  3. (z)->is_ref__gc = 0; 

那麼 zval到底是什麼呢
在zend/zend.h裏面
typedef struct _zval_struct zval; //原來它是 _zval_struct 的別名
_zval_struct 定義如下

 

  1. typedef union _zvalue_value { 
  2.         long lval;  //保存long類型的數據 
  3.         double dval; //保存 double類型的數據 
  4.         struct { 
  5.                 char *val; //真正的值在這裏 
  6.                 int len;   //這裏返回長度 
  7.         } str; 
  8.         HashTable *ht; 
  9.         zend_object_value obj; //這是一個對象 
  10. } zvalue_value; 
  11.   
  12. struct _zval_struct { 
  13. zvalue_value value;             //保存的值 
  14. zend_uint refcount__gc;//被引用的次數 如果爲1 則只被自己使用如果大於1 則被其他變量以&的形式引用. 
  15. zend_uchar type;       //數據類型 這也是 爲什麼 PHP是弱類型的原因 
  16. zend_uchar is_ref__gc;  //表示是否爲引用 
  17. }; 

如果還是不夠清楚..那麼我們實戰一下..用C來創建一個PHP變量
這裏需要一個擴展,PHP如果用C擴展模塊 這裏就不說了
關鍵代碼

 

  1. PHP_FUNCTION(test_siren){ 
  2.         zval *value; 
  3.         char *s="create a php variable"
  4.         value=(zval*)malloc(sizeof(zval)); 
  5.         memset(value,0,sizeof(value)); 
  6.         value->is_ref__gc=0; //非引用變量 
  7.         value->refcount__gc=1;//引用次數 只有自己 
  8.         value->type=IS_STRING;//類型爲字符串 
  9.         value->value.str.val=s;//值 
  10.         value->value.str.len=strlen(s);//長度 
  11.         ZEND_SET_SYMBOL(EG(active_symbol_table),"a",value); 

第三行和第四行的作用 與MAKE_STD_ZVAL的作用相同,給value分配內存空間
第5-9行 的作用與ZVAL_STRING的作用相同,
最後一行 是將value創建一個 在PHP裏叫$a的變量..並添加到局部Hash表裏..
這樣 在PHP裏

 

  1. <?php 
  2. test_siren(1); 
  3. echo $a; 
  4. ?> 

就會輸出 “create a php variable”
OK,
大功告成
注意,我是爲了讓大家看到PHP內部創建變量的流程 才採用C的形式創建變量,
絕對不推薦大家這樣做.
還是一定要用PHP內部的內存管理機制分配並處理內存。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章