java中string,stringbuffer和stringbuilder的問題

關於StringBuilder,一般同學只簡單記住了,字符串拼接要用StringBuilder,不要用+,也不要用StringBuffer,然後性能就是最好的了,真的嗎嗎嗎嗎?

 

1.初始長度好重要,值得說四次。

StringBuilder的內部有一個char[], 不斷的append()就是不斷的往char[]裏填東西的過程。

new StringBuilder() 時char[]的默認長度是16,然後,如果要append第17個字符,怎麼辦?

用System.arraycopy成倍複製擴容!!!!

這樣一來有數組拷貝的成本,二來原來的char[]也白白浪費了要被GC掉。可以想見,一個129字符長度的字符串,經過了16,32,64, 128四次的複製和丟棄,合共申請了496字符的數組,在高性能場景下,這幾乎不能忍。

所以,合理設置一個初始值多重要。

但如果我實在估算不好呢?多估一點點好了,只要字符串最後大於16,就算浪費一點點,也比成倍的擴容好。

 浪費了一倍的char[]

浪費發生在最後一步,StringBuilder.toString()

// Create a copy, don't share the array
return new String(value, 0, count);

String的構造函數會用 System.arraycopy()複製一把傳入的char[]來保證安全性不可變性,如果故事就這樣結束,StringBuilder裏的char[]還是被白白犧牲了。

爲了不浪費這些char[],一種方法是用Unsafe之類的各種黑科技,繞過構造函數直接給String的char[]和count屬性賦值,但很少人這樣做。

另一個靠譜一些的辦法就是重用StringBuilder。而重用,還解決了前面的長度設置問題,因爲即使一開始估算不準,多擴容幾次之後也夠了。

4.重用StringBuilder

這個做法來源於JDK裏的BigDecimal類(沒事看看JDK代碼多重要),SpringSide裏將代碼提取成StringBuilderHolder,裏面只有一個函數

public StringBuilder getStringBuilder() {
     sb.setLength(0);
     return sb;
}

StringBuilder.setLength()函數只重置它的count指針,而char[]則會繼續重用,而toString()時會把當前的count指針也作爲參數傳給String的構造函數,所以不用擔心把超過新內容大小的舊內容也傳進去了。可見,StringBuilder是完全可以被重用的。

爲了避免併發衝突,這個Holder一般設爲ThreadLocal,標準寫法見BigDecimal或StringBuilderHolder的註釋。

5.+ 與 StringBuilder

String s = “hello ” + user.getName();

這一句經過javac編譯後的效果,的確等價於使用StringBuilder,但沒有設定長度。

String s = new StringBuilder().append(“hello”).append(user.getName());

但是,如果像下面這樣:

String s = “hello ”;
// 隔了其他一些語句
s = s + user.getName();

每一條語句,都會生成一個新的StringBuilder,這裏就有了兩個StringBuilder,性能就完全不一樣了。如果是在循環體裏s+=i; 就更加多得沒譜。

據R大說,努力的JVM工程師們在運行優化階段, 根據+XX:+OptimizeStringConcat(JDK7u40後默認打開),把相鄰的(中間沒隔着控制語句) StringBuilder合成一個,也會努力的猜長度。

所以,保險起見還是繼續自己用StringBuilder並設定長度好了。

StringBuffer 與 StringBuilder

StringBuffer與StringBuilder都是繼承於AbstractStringBuilder,唯一的區別就是StringBuffer的函數上都有synchronized關鍵字。

涉及多線程安全的需要使用StringBuffer

永遠把日誌的字符串拼接交給slf4j??

logger.info("Hello {}", user.getName());

對於不知道要不要輸出的日誌,交給slf4j在真的需要輸出時纔去拼接的確能省節約成本。

但對於一定要輸出的日誌,直接自己用StringBuilder拼接更快。因爲看看slf4j的實現,實際上就是不斷的indexof(“{}”), 不斷的subString(),再不斷的用StringBuilder拼起來而已,沒有銀彈。

PS. slf4j中的StringBuilder在原始Message之外預留了50個字符,如果可變參數加起來長過50字符還是得複製擴容……而且StringBuilder也沒有重用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章