PHP源碼分析-變量的存儲方式

PHP中的變量類型和值是通過C語言實現的,內核具體是如何組織用戶在PHP中定義的變量呢?
HashTable在ZE內核中被廣泛使用,PHP變量也正是存儲在一個HashTable實現的符號表裏。

當在PHP中調用一個函數或者類時,內核會創建一個新的符號表,這也是爲什麼在函數中無法使用函數外部定義的變量的原因。(因爲他們分屬兩個符號表,一個當前作用域,一個全局作用域)


現在來看內核中是如何定義作用域的:

struct _zend_executor_globals {
    //略
    HashTable symbol_table;//全局變量的符號表
    HashTable *active_symbol_table;//局部變量的符號表
    //略
};

可以通過EG宏來訪問變量符號表,EG(symbol_table)訪問全局作用域的變量符號表,EG(active_symbol_table)訪問當前作用域的變量符號表。


<?php
$foo='bar';
?>

上面這段代碼很簡單,創建變量foo,並賦值bar。之後的PHP代碼中就可以調用$foo變量了。
現在看看PHP中定義的變量,內核中是如何實現的。僞代碼:

zval* foo;
MAKE_STD_ZVAL(foo);
ZVAL_STRING(foo, "bar", 1);
ZEND_SET_SYMBOL( EG(active_symbol_table), "foo", foo);

第一步、創建一個zval結構,並設置類型。
第二步、賦值爲bar。
第三步、將其加入當前作用域符號表,只有這樣用戶才能在PHP裏使用這個變量。

通過簡單的這三步,即可實現定義PHP變量。簡單的原因,在於內核爲我們提供了強大的宏。現在我們將宏分別展開。

MAKE_STD_ZVAL應用到的宏有:

#define 	MAKE_STD_ZVAL(zv)				ALLOC_ZVAL(zv);INIT_PZVAL(zv)
#define 	ALLOC_ZVAL(z)					ZEND_FAST_ALLOC(z, zval, ZVAL_CACHE_LIST)
#define 	ZEND_FAST_ALLOC(p, type, fc_type)		(p) = (type *) emalloc(sizeof(type))
#define 	INIT_PZVAL(z)						(z)->refcount__gc = 1;(z)->is_ref__gc = 0;
MAKE_STD_ZVAL(foo)展開後得到:
(foo) = (zval *) emalloc(sizeof(zval));
(foo)->refcount__gc = 1;
(foo)->is_ref__gc = 0;
可以看出,MAKE_STD_ZVAL做了三件事:分配內存、初始化zval結構中的refcount、is_ref。

ZVAL_STRING應用到的宏有:

#define ZVAL_STRING(z, s, duplicate) {	\
		const char *__s=(s);			\
		Z_STRLEN_P(z) = strlen(__s);	\
		Z_STRVAL_P(z) = (duplicate?estrndup(__s, Z_STRLEN_P(z)):(char*)__s);\
		Z_TYPE_P(z) = IS_STRING;		\
	}
#define Z_STRLEN_P(zval_p)		Z_STRLEN(*zval_p)
#define Z_STRLEN(zval)			(zval).value.str.len
#define Z_STRVAL_P(zval_p)		Z_STRVAL(*zval_p)
#define Z_STRVAL(zval)			(zval).value.str.val
#define Z_TYPE_P(zval_p)			Z_TYPE(*zval_p)
#define Z_TYPE(zval)			(zval).type
#define IS_STRING				6
展開後得到:

const char *__s=("foo");
(foo).value.str.len=strlen(__s);
(foo).value.str.val=(duplicate?estrndup(__s, (zval).value.str.len):(char*)__s);
(foo).type=6;
ZVAL_STRING做的工作是設置數據類型並賦值。


ZEND_SET_SYMBOL這裏只展開一部分宏,因爲它展開後過於複雜。

# define EG(v) (executor_globals.v)
展開部分後得到:
ZEND_SET_SYMBOL(executor_globals.active_symbol_table, "foo", foo);
將變量名入當前作用域符號表。


注:之所以使用內核提供的宏來分配內存、註冊變量作用域,是因爲這樣能提高兼容性。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章