剛開始學習C#的時候,就聽說CLR對於String類有一種特別的記憶體管理機制:有時候,明明聲明瞭兩個String類的對象,但是他們偏偏卻指向同一個實例。如下: String s1 = "Hello";String s2 = "Hello"; //s2和s1的實際值都是“Hello”bool same ...
剛開始學習C#的時候,就聽說CLR對於String類有一種特別的記憶體管理機制:有時候,明明聲明瞭兩個String類的對象,但是他們偏偏卻指向同一個實例。如下:
String s1 = "Hello";
String s2 = "Hello"; //s2和s1的實際值都是“Hello”
bool same = (object) s1 == (object) s2; //這裡比較s1、s2是否引用了同一個對象實例
//所以不能寫作bool same = s1 == s2;
//因為String類重載了==操作符來比較String對象包含的實際值
這裡的same會被賦值為true。也就是說s1真的和s2引用了同一個String對象。當然,應該註意到的是s1和s2都被統一賦值為同一個字元串“Hello”,這才是出現上述情況的原因。
現在我們初步得出結論,當有多個字元串變數包含了同樣的字元串實際值時,CLR可能不會為它們重覆地分配記憶體,而是讓它們統統指向同一個字元串對象實例。(這裡我說了“可能”,是因為某些情況下,確實也會發生同一個字元串實際值在記憶體中有多份副本同時存在。請繼續往下看。)
我們知道,String類有很多特別的地方,其中之一就是它是“不會改變的”(immutable)。這說明在我們每次對一個String對象進行操作時(比如說使用Trim,Replace等方法),並不是真的對這個String對象的實例進行修改,而是返回一個新的String對象實例作為操作執行的結果。String對象的實例一經生成,到死都不會被改變了!
基於String類這樣的特性,CLR讓表示相同的字元串實際值的變數指向同一個String事例,就是完全合理的了。因為利用任何一個對String實例的引用所進行的修改操作都不會切實地影響到該實例的狀態,也就不會影響到其他所有指向該實例的引用所表示的字元串實際值。CLR如此管理String類的記憶體分配,可以優化記憶體的使用情況,避免記憶體中包含冗餘的數據。
為了實現這個機制,CLR默默地維護了一個叫做駐留池(Intern Pool)的表。這個表記錄了所有在代碼中使用字面量聲明的字元串實例的引用。這說明使用字面量聲明的字元串會進入駐留池,而其他方式聲明的字元串並不會進入,也就不會自動享受到CLR防止字元串冗餘的機制的好處了。這就是我上文提到的“某些情況下,確實也會發生同一個字元串實際值在記憶體中有多份副本同時存在”的例子。請看這個例子:
StringBuilder sb = new StringBuilder();
sb.Append("He").Append("llo");
string s1 = "Hello";
string s2 = sb.ToString();
bool same = (object) s1 == (object) s2;
這時same就不是true了,因為雖然s1,s2表示的是相同的字元串,但是由於s2不是通過字面量聲明的,CLR在為sb.ToString()方法的返回值分配記憶體時,並不會到駐留池中去檢查是否有值為“Hello”的字元串已經存在了,所以自然不會讓s2指向駐留池內的對象。
為了讓編程者能夠強制CLR檢查駐留池,以避免冗餘的字元串副本,String類的設計者提供了一個名為Intern的類方法。下麵是該方法的一個示例:
StringBuilder sb = new StringBuilder();
sb.Append("He").Append("llo");
string s1 = "Hello";
string s2 = String.Intern(sb.ToString());
bool same = (object) s1 == (object) s2;
好了,same又是true了。Intern方法接受一個字元串作為參數,它會在駐留池中檢查是否存在參數所表示的字元串。如果存在,則返回那個駐留池中的字元串的引用;否則向駐留池中加入一個新的表示相同值的字元串,並返回這個字元串的引用。不過要註意的是,就算Intern方法在駐留池中找到了相同值的字元串,也不能讓您省卻一次字元串記憶體分配的操作,因為作為參數的字元串已經被分配了一次記憶體了。而使用Intern方法的好處在於,如果Intern方法在駐留池中找到了相同值的字元串,此時雖然在記憶體中存在兩份該字元串的副本(一份是參數,一份是駐留池中的),但是隨著時間的流逝,參數所引用的那個副本會被垃圾回收掉,這樣對於該字元串記憶體中就不存在冗餘了。 當您的程式中存在某個方法,可以根據不同的上下文環境創建並返回一個很長的字元串,而在程式運行的過程中它有會經常返回同樣的字元串時,您可能就要考慮考慮使用Intern方法來提高記憶體的利用率了。 不過同樣值得註意的是,使用Intern方法讓一個字元串存活於駐留池中也有一個副作用:即使已經不存在任何其它引用指向駐留池中的字元串了,這個字元串仍然不一定會被垃圾回收掉。也就是說即使駐留池中的字元串已經沒有用處了,它可能也要等到CLR終結時才被銷毀。當您使用Intern方法的時候,也應該考慮到這個特殊的行為。