【轉】原來是這樣:C#中字符串的內存分配與駐留池

作者:cyoooo7 2011-05-24 23:23

出處:博客園


剛開始學習C#的時候,就聽說CLR對於String類有一種特別的內存管理機制:有時候,明明聲明瞭兩個String類的對象,但是他們偏偏卻指向同一個實例。如下:

複製代碼
String s1 = "Hello"; String s2 = "Hello"; //s2和s1的實際值都是“Hello” bool same = (object) s1 == (object) s2; //這裏比較s1、s2是否引用了同一個對象實例 //所以不能寫作bool same = s1 == s2; //因爲String類重載了==操作符來比較String對象包含的實際值
複製代碼

這裏的same會被賦值爲true。也就是說s1真的和s2引用了同一個String對象。當然,應該注意到的是s1和s2都被統一賦值爲同一個字符串“Hello”,這纔是出現上述情況的原因。

現在我們初步得出結論,當有多個字符串變量包含了同樣的字符串實際值時,CLR可能不會爲它們重複地分配內存,而是讓它們統統指向同一個字符串對象實例。(這裏我說了“可能”,是因爲某些情況下,確實也會發生同一個字符串實際值在內存中有多份副本同時存在。請繼續往下看。)

我們知道,String類有很多特別的地方,其中之一就是它是“不會改變的”(immutable)。這說明在我們每次對一個String對象進行操作時(比如說使用Trim,Replace等方法),並不是真的對這個String對象的實例進行修改,而是返回一個新的String對象實例作爲操作執行的結果。String對象的實例一經生成,到死都不會被改變了!

基於String類這樣的特性,CLR讓表示相同的字符串實際值的變量指向同一個String事例,就是完全合理的了。因爲利用任何一個對String實例的引用所進行的修改操作都不會切實地影響到該實例的狀態,也就不會影響到其他所有指向該實例的引用所表示的字符串實際值。CLR如此管理String類的內存分配,可以優化內存的使用情況,避免內存中包含冗餘的數據。

爲了實現這個機制,CLR默默地維護了一個叫做駐留池(Intern Pool)的表。這個表記錄了所有在代碼中使用字面量聲明的字符串實例的引用。這說明使用字面量聲明的字符串會進入駐留池,而其他方式聲明的字符串並不會進入,也就不會自動享受到CLR防止字符串冗餘的機制的好處了。這就是我上文提到的“某些情況下,確實也會發生同一個字符串實際值在內存中有多份副本同時存在”的例子。請看這個例子:

複製代碼
StringBuilder sb = new StringBuilder(); sb.Append("He").Append("llo");
string s1 = "Hello"; string s2 = sb.ToString(); bool same = (object) s1 == (object) s2;
複製代碼

這時same就不是true了,因爲雖然s1,s2表示的是相同的字符串,但是由於s2不是通過字面量聲明的,CLR在爲sb.ToString()方法的返回值分配內存時,並不會到駐留池中去檢查是否有值爲“Hello”的字符串已經存在了,所以自然不會讓s2指向駐留池內的對象。

爲了讓編程者能夠強制CLR檢查駐留池,以避免冗餘的字符串副本,String類的設計者提供了一個名爲Intern的類方法。下面是該方法的一個示例:

 

複製代碼
StringBuilder sb = new StringBuilder(); sb.Append("He").Append("llo");
string s1 = "Hello"; string s2 = String.Intern(sb.ToString()); bool same = (object) s1 == (object) s2;
複製代碼


好了,same又是true了。Intern方法接受一個字符串作爲參數,它會在駐留池中檢查是否存在參數所表示的字符串。如果存在,則返回那個駐留池中的字符串的引用;否則向駐留池中加入一個新的表示相同值的字符串,並返回這個字符串的引用。不過要注意的是,就算Intern方法在駐留池中找到了相同值的字符串,也不能讓您省卻一次字符串內存分配的操作,因爲作爲參數的字符串已經被分配了一次內存了。而使用Intern方法的好處在於,如果Intern方法在駐留池中找到了相同值的字符串,此時雖然在內存中存在兩份該字符串的副本(一份是參數,一份是駐留池中的),但是隨着時間的流逝,參數所引用的那個副本會被垃圾回收掉,這樣對於該字符串內存中就不存在冗餘了。

 

 

 

當您的程序中存在某個方法,可以根據不同的上下文環境創建並返回一個很長的字符串,而在程序運行的過程中它有會經常返回同樣的字符串時,您可能就要考慮考慮使用Intern方法來提高內存的利用率了。

 

 

 

不過同樣值得注意的是,使用Intern方法讓一個字符串存活於駐留池中也有一個副作用:即使已經不存在任何其它引用指向駐留池中的字符串了,這個字符串仍然不一定會被垃圾回收掉。也就是說即使駐留池中的字符串已經沒有用處了,它可能也要等到CLR終結時才被銷燬。當您使用Intern方法的時候,也應該考慮到這個特殊的行爲。

發佈了4 篇原創文章 · 獲贊 0 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章