此問題在項目中被發現,經查看JDK源碼(JDK1.6),String類的public String substring(int beginIndex, int endIndex)的實現讓我很意外。
想重現這個場景很容易,請看代碼。
- import java.util.ArrayList;
- import java.util.List;
- public class LeakTest {
- public static void main(String...args) {
- List<String> handler = new ArrayList<String>();
- for(int i = 0; i < 100000; i++) {
- Huge h = new Huge();
- handler.add(h.getSubString(1, 5));
- }
- }
- }
- class Huge {
- private String str = new String(new char[100000]);
- public String getSubString(int begin, int end) {
- return str.substring(begin, end);
- }
- }
執行此代碼結果:
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
問題就出在Huge類的 getSubString 方法,它調用了String類的substring方法。
來讓我們看看 substring 類的實現吧,JDK源碼如下:
- public String substring(int beginIndex, int endIndex) {
- if (beginIndex < 0) {
- throw new StringIndexOutOfBoundsException(beginIndex);
- }
- if (endIndex > count) {
- throw new StringIndexOutOfBoundsException(endIndex);
- }
- if (beginIndex > endIndex) {
- throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
- }
- return ((beginIndex == 0) && (endIndex == count)) ? this :
- new String(offset + beginIndex, endIndex - beginIndex, value);
- }
再讓我們接下來看看 new String(offset + beginIndex, endIndex - beginIndex, value); 的實現:
- // Package private constructor which shares value array for speed.
- String(int offset, int count, char value[]) {
- this.value = value;
- this.offset = offset;
- this.count = count;
- }
char[] value 數組被共享了。
在我們的main函數裏的循環中,每循環一次後,我們希望Huge對象被回收,且釋放它佔有的內存。
但實際上 private String str = new String(new char[100000]); 佔有的內存並不會被釋放。
因爲 我們通過 Huge 類的 getSubString 方法得到的 String 對象還存在(存在於handler的列表中),
它雖然是 length 只有 4 的對象,卻享有着 char[100000] 的空間。
解決方案:
可以修改Huge 類的 getSubString 方法如下:
- public String getSubString(int begin, int end) {
- return new String(str.substring(begin, end));
- }
只要再套一個String的構造方法即可。
至於爲什麼,看看JDK源碼,一看便知了。這裏就不貼出來了。
唉,以後寫代碼得多多小心啊。