昨天還在 for 循環裏寫加號拼接字符串的那個同事,今天已經不在了

引言

都說 StringBuilder 在處理字符串拼接上效率要強於 String,但有時候我們的理解可能會存在一定的偏差。最近我在測試數據導入效率的時候就發現我以前對 StringBuilder 的部分理解是錯誤的。後來我通過實踐測試 + 找原理 的方式搞清楚了這塊的邏輯。現在將過程分享給大家

測試用例

我們的代碼在循環中拼接字符串一般有兩種情況

  • 第一種就是每次循環將對象中的幾個字段拼接成一個新字段,再賦值給對象
  • 第二種操作是在循環外創建一個字符串對象,每次循環向該字符串拼接新的內容。循環結束後得到拼接好的字符串

對於這兩種情況,我創建了兩個對照組

第一組:

在每次 For 循環中拼接字符串,即拼即用、用完即毀。分別使用 String 和 StringBuilder 拼接

    /**
     * 循環內 String 拼接字符串,一次循環後銷燬
     */
    public static void useString(){
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            String str = str1 + i + str2 + i + str3 + i + str4 ;
        }
    }

    /**
     * 循環內 使用 StringBuilder 拼接字符串,一次循環後銷燬
     */
    public static void useStringBuilder(){
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            StringBuilder sb = new StringBuilder();
            String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString();
        }
    }

第二組:

多次 For 循環拼接一個字符串,循環結束後使用字符串,使用後由垃圾回收器回收。也是分別使用 String 和 StringBuilder 拼接

    /**
     * 多次循環拼接成一個字符串 用 String
     */
    public static void useStringSpliceOneStr (){
        String str = "";
        for (int i = 0; i < CYCLE_NUM_LOWER; i++) {
            str += str1 + str2 + str3 + str4 + i;
        }
    }

    /**
     * 多次循環拼接成一個字符串 用 StringBuilder
     */
    public static void useStringBuilderSpliceOneStr(){
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_LOWER; i++) {
            sb.append(str1).append(str2).append(str3).append(str4).append(i);
        }
    }

爲了保證測試質量,在每個測試項目進行前。線程休息 2s,之後空跑 5 次熱身。最後執行 5 次求平均時間的方式計算時間

    public static int executeSometime(int kind, int num) throws InterruptedException {
        Thread.sleep(2000);
        int sum = 0;
        for (int i = 0; i < num + 5; i++) {
            long begin = System.currentTimeMillis();

            switch (kind){
                case 1:
                    useString();
                    break;
                case 2:
                    useStringBuilder();
                    break;
                case 3:
                    useStringSpliceOneStr();
                    break;
                case 4:
                    useStringBuilderSpliceOneStr();
                    break;
                default:
                    return 0;
            }

            long end = System.currentTimeMillis();

            if(i > 5){
                sum += (end - begin);
            }
        }
        return sum / num;
    }

主方法

public class StringTest {
    public static final int CYCLE_NUM_BIGGER = 10_000_000;
    public static final int CYCLE_NUM_LOWER = 10_000;
    public static final String str1 = "張三";
    public static final String str2 = "李四";
    public static final String str3 = "王五";
    public static final String str4 = "趙六";


    public static void main(String[] args) throws InterruptedException {
        int time = 0;
        int num = 5;

        time = executeSometime(1, num);
        System.out.println("String拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均時間:" + time + " ms");

        time = executeSometime(2, num);
        System.out.println("StringBuilder拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均時間:" + time + " ms");

        time = executeSometime(3, num);
        System.out.println("String拼接單個字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均時間:" + time + " ms");

        time = executeSometime(4, num);
        System.out.println("StringBuilder拼接單個字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均時間:" + time + " ms");

    }
}

測試結果

測試結果如下:


結果分析

第一組
10_000_000 次循環拼接,在循環內使用 String 和 StringBuilder 的效率是一樣的!爲什麼呢?

使用 javap -c StringTest.class 反編譯查看兩個方法編譯後的文件:



可以發現 String 方法拼接字符串編譯器優化後使用的就是 StringBuilder、因此用例1 和用例2 的效率是一樣的。

第二組
第二組的結果就是大家喜聞樂見的了,由於 10_000_000 次循環String 拼接實在太慢所以我採用了 10_000 次拼接來分析。

分析用例3:雖然編譯器會對 String 拼接做優化,但是它每次在循環內創建 StringBuilder 對象,在循環內銷燬。下次循環他有創建。相比較用例4在循環外創建,多了 n 次 new 對象、銷燬對象的操作、n - 1 次將 StringBuilder 轉換成 String 的操作 。效率低也是理所應當了。

擴展
第一組的測試還有一種寫法:

    /**
     * 循環內 使用 StringBuilder 拼接字符串,一次循環後銷燬
     */
    public static void useStringBuilderOut(){
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
//            sb.setLength(0);
            sb.delete(0, sb.length());
            String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString();
        }
    }

循環外創建 StringBuilder 每次循環開始的時候清空 StringBuilder 的內容然後拼接。這種寫法無論使用 sb.setLength(0); 還是 sb.delete(0, sb.length()); 效率都比直接在循環內使用 String / StringBuilder 慢。奈何才疏學淺我一直想不明白爲什麼他慢。我猜測是 new 對象的速度比重置長度慢,於是這樣測試了以下:

    public static void createStringBuider() {
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            StringBuilder sb = new StringBuilder();
        }
    }

    public static void cleanStringBuider() {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            sb.delete(0, sb.length());
        }
    }

但是結果是 cleanStringBuider 更快。讓我摸不着頭腦

如果有大神看到希望可以幫忙分析分析

結論

  • 編譯器會將 String 拼接優化成使用 StringBuilder,但是還是有一些缺陷的。主要體現在循環內使用字符串拼接,編譯器不會創建單個 StringBuilder 以複用
  • 對於多次循環內拼接一個字符串的需求:StringBuilder 很快,因爲其避免了 n 次 new 對象、銷燬對象的操作,n - 1 次將 StringBuilder 轉換成 String 的操作
  • StringBuilder 拼接不適用於循環內每次拼接即用的操作方式。因爲編譯器優化後的 String 拼接也是使用 StringBuilder 兩者的效率一樣。後者寫起來還方便...

歡迎關注我的微信公衆號「碼農突圍」,分享Python、Java、大數據、機器學習、人工智能等技術,關注碼農技術提升•職場突圍•思維躍遷,20萬+碼農成長充電第一站,陪有夢想的你一起成長

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章