深入理解PHP內存管理之誰動了我的內存

首先讓我們看一個問題: 如下代碼的輸出,

var_dump(memory_get_usage());
$a = "laruence";
var_dump(memory_get_usage());
unset($a);
var_dump(memory_get_usage());

輸出(在我的個人電腦上, 可能會因爲系統,PHP版本,載入的擴展不同而不同):

int(90440)
int(90640)
int(90472)

注意到 90472-90440=32, 於是就有了各種的結論, 有的人說PHP的unset並不真正釋放內存, 有的說, PHP的unset只是在釋放大變量(大量字符串, 大數組)的時候纔會真正free內存, 更有人說, 在PHP層面討論內存是沒有意義的.

那麼, 到底unset會不會釋放內存? 這32個字節跑哪裏去了?

要回答這個問題, 我將從倆個方面入手:

這32個字節去哪裏了

首先我們要打破一個思維: PHP不像C語言那樣, 只有你顯示的調用內存分配相關API纔會有內存的分配.
也就是說, 在PHP中, 有很多我們看不到的內存分配過程.
比如對於:

$a = “laruence”;
隱式的內存分配點就有:

  1. 爲變量名分配內存, 存入符號表
  2. 爲變量值分配內存
    所以, 不能只看表象.
    第二, 別懷疑,PHP的unset確實會釋放內存(當然, 還要結合引用和計數, 這部分的內容請參看我之前的文章深入理解PHP原理之變量分離/引用), 但這個釋放不是C編程意義上的釋放, 不是交回給OS.
    對於PHP來說, 它自身提供了一套和C語言對內存分配相似的內存管理API:
emalloc(size_t size);
efree(void *ptr);
ecalloc(size_t nmemb, size_t size);
erealloc(void *ptr, size_t size);
estrdup(const char *s);
estrndup(const char *s, unsigned int length);

這些API和C的API意義對應, 在PHP內部都是通過這些API來管理內存的.

當我們調用emalloc申請內存的時候, PHP並不是簡單的向OS要內存, 而是會像OS要一個大塊的內存, 然後把其中的一塊分配給申請者, 這樣當再有邏輯來申請內存的時候, 就不再需要向OS申請內存了, 避免了頻繁的系統調用.

比如如下的例子:

<?php
var_dump(memory_get_usage(TRUE)); //注意獲取的是real_size
$a = "laruence";
var_dump(memory_get_usage(TRUE));
unset($a);
var_dump(memory_get_usage(TRUE));

輸出:

int(262144)
int(262144)
int(262144)

也就是我們在定義變量$a的時候, PHP並沒有向系統申請新內存.

同樣的, 在我們調用efree釋放內存的時候, PHP也不會把內存還給OS, 而會把這塊內存, 歸入自己維護的空閒內存列表. 而對於小塊內存來說, 更可能的是, 把它放到內存緩存列表中去(後記, 某些版本的PHP, 比如我驗證過的PHP5.2.4, 5.2.6, 5.2.8, 在調用get_memory_usage()的時候, 不會減去內存緩存列表中的可用內存塊大小, 導致看起來, unset以後內存不變, 見評論).

現在讓我來回答這32個字節跑哪裏去了, 就向我剛纔說的, 很多內存分配的過程不是顯式的, 看了下面的代碼你就明白了:

<?php
var_dump("I am Laruence, From http://www.laruence.com");
var_dump(memory_get_usage());
$a = "laruence";
var_dump(memory_get_usage());
unset($a);
var_dump(memory_get_usage());

輸出:

string(43) “I am Laruence, From http://www.laruence.com
int(90808)//賦值前
int(90976)
int(90808) //是的, 內存正常釋放了

90808-90808 = 0, 正常了, 也就是說這32個字節是被輸出函數給佔用了(嚴格來說, 是被輸出的Header佔用了)

只增不減的數組

Hashtable是PHP的核心結構(瞭解Hashtable, 可以參看我之前的文章深入理解PHP之數組(遍歷順序)), 數組也是用她來表示的, 而符號表也是一種關聯數組, 對於如下代碼:

var_dump("I am Laruence, From http://www.laruence.com");
var_dump(memory_get_usage());
$array = array_fill(1, 100, "laruence");
foreach ($array as $key => $value) {
    ${$value . $key} = NULL;
}
var_dump(memory_get_usage());
foreach ($array as $key=> $value) {
    unset(${$value . $key});
}
var_dump(memory_get_usage());

我們定義了100個變量, 然後又按個Unset了他們, 來看看輸出:

string(43) “I am Laruence, From http://www.laruence.com
int(93560)
int(118848)
int(104448)

Wow, 怎麼少了這麼多內存?
這是因爲對於Hashtable來說, 定義它的時候, 不可能一次性分配足夠多的內存塊, 來保存未知個數的元素, 所以PHP會在初始化的時候, 只是分配一小部分內存塊給HashTable, 當不夠用的時候再RESIZE擴容,

而Hashtable, 只能擴容, 不會減少, 對於上面的例子, 當我們存入100個變量的時候, 符號表不夠用了, 做了一次擴容, 而當我們依次unset掉這100個變量以後, 變量佔用的內存是釋放了(118848 – 104448), 但是符號表並沒有縮小, 所以這些少的內存是被符號表本身佔去了…

現在, 你是不是對PHP的內存管理有了一個初步的認識了呢?

發佈了26 篇原創文章 · 獲贊 62 · 訪問量 13萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章