羞,Java 字元串拼接竟然有這麼多姿勢

来源:https://www.cnblogs.com/qing-gee/archive/2019/11/14/11854565.html
-Advertisement-
Play Games

二哥,我今年大二,看你分享的《阿裡巴巴 Java 開發手冊》上有一段內容說:“迴圈體內,拼接字元串最好使用 StringBuilder 的 append 方法,而不是 + 號操作符。”到底為什麼啊,我平常一直就用的‘+’號操作符啊!二哥有空的時候能否寫一篇文章分析一下呢? 就在昨天,一位叫小菜的讀者 ...


二哥,我今年大二,看你分享的《阿裡巴巴 Java 開發手冊》上有一段內容說:“迴圈體內,拼接字元串最好使用 StringBuilder 的 append 方法,而不是 + 號操作符。”到底為什麼啊,我平常一直就用的‘+’號操作符啊!二哥有空的時候能否寫一篇文章分析一下呢?

就在昨天,一位叫小菜的讀者微信我說了上面這段話。

我當時看到這條微信的第一感覺是:小菜你也太菜了吧,這都不知道為啥啊!我估計正在讀這篇文章的你也會有同樣的感覺。

但捫心自問,在做程式員的前兩年內,我也不知道為啥。遇到字元串拼接就上“+”號操作符,甭管是不是在迴圈體內。和小菜比起來,我當時可沒他這麼幸運,還有一位熱心的“二哥”能夠分享這份價值連城的開發手冊。

既然我這麼熱心分享,不如好人做到底,對不對?我就認認真真地寫一篇文章,給小菜解惑一下。

01、“+”號操作符

要說姿勢,“+”號操作符必須是字元串拼接最常用的一種了,沒有之一。

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo + wanger);

我們把這段代碼使用 JAD 反編譯一下。

String chenmo = "\u6C89\u9ED8"; // 沉默
String wanger = "\u738B\u4E8C"; // 王二
System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());

我去,原來編譯的時候把“+”號操作符替換成了 StringBuilder 的 append 方法。也就是說,“+”號操作符在拼接字元串的時候只是一種形式主義,讓開發者使用起來比較簡便,代碼看起來比較簡潔,讀起來比較順暢。算是 Java 的一種語法糖吧。

02、StringBuilder

除去“+”號操作符,StringBuilder 的 append 方法就是第二個常用的字元串拼接姿勢了。

先來看一下 StringBuilder 類的 append 方法的源碼:

public StringBuilder append(String str) {
    super.append(str);
    return this;
}

這 3 行代碼沒啥可看的,可看的是父類 AbstractStringBuilder 的 append 方法:

public AbstractStringBuilder append(String str) {
    if (str == null)
        return appendNull();
    int len = str.length();
    ensureCapacityInternal(count + len);
    str.getChars(0, len, value, count);
    count += len;
    return this;
}

1)判斷拼接的字元串是不是 null,如果是,當做字元串“null”來處理。appendNull 方法的源碼如下:

private AbstractStringBuilder appendNull() {
    int c = count;
    ensureCapacityInternal(c + 4);
    final char[] value = this.value;
    value[c++] = 'n';
    value[c++] = 'u';
    value[c++] = 'l';
    value[c++] = 'l';
    count = c;
    return this;
}

2)拼接後的字元數組長度是否超過當前值,如果超過,進行擴容並複製。ensureCapacityInternal 方法的源碼如下:

private void ensureCapacityInternal(int minimumCapacity) {
    // overflow-conscious code
    if (minimumCapacity - value.length > 0) {
        value = Arrays.copyOf(value,
                newCapacity(minimumCapacity));
    }
}

3)將拼接的字元串 str 複製到目標數組 value 中。

str.getChars(0, len, value, count)

03、StringBuffer

先有 StringBuffer 後有 StringBuilder,兩者就像是孿生雙胞胎,該有的都有,只不過大哥 StringBuffer 因為多呼吸兩口新鮮空氣,所以是線程安全的。

public synchronized StringBuffer append(String str) {
    toStringCache = null;
    super.append(str);
    return this;
}

StringBuffer 類的 append 方法比 StringBuilder 多了一個關鍵字 synchronized,可暫時忽略 toStringCache = null

synchronized 是 Java 中的一個非常容易臉熟的關鍵字,是一種同步鎖。它修飾的方法被稱為同步方法,是線程安全的。

04、String 類的 concat 方法

單就姿勢上來看,String 類的 concat 方法就好像 StringBuilder 類的 append。

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo.concat(wanger));

文章寫到這的時候,我突然產生了一個奇妙的想法。假如有這樣兩行代碼:

chenmo += wanger
chenmo = chenmo.concat(wanger)

它們之間究竟有多大的差別呢?

之前我們已經瞭解到,chenmo += wanger 實際上相當於 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()

要探究“+”號操作符和 concat 之間的差別,實際上要看 append 方法和 concat 方法之間的差別。

append 方法的源碼之前分析過了。我們就來看一下 concat 方法的源碼吧。

public String concat(String str) {
    int otherLen = str.length();
    if (otherLen == 0) {
        return this;
    }
    int len = value.length;
    char buf[] = Arrays.copyOf(value, len + otherLen);
    str.getChars(buf, len);
    return new String(buf, true);
}

1)如果拼接的字元串的長度為 0,那麼返回拼接前的字元串。

if (otherLen == 0) {
    return this;
}

2)將原字元串的字元數組 value 複製到變數 buf 數組中。

char buf[] = Arrays.copyOf(value, len + otherLen);

3)把拼接的字元串 str 複製到字元數組 buf 中,並返回新的字元串對象。

str.getChars(buf, len);
return new String(buf, true);

通過源碼分析我們大致可以得出以下結論:

1)如果拼接的字元串是 null,concat 時候就會拋出 NullPointerException,“+”號操作符會當做是“null”字元串來處理。

2)如果拼接的字元串是一個空字元串(""),那麼 concat 的效率要更高一點。畢竟不需要 new StringBuilder 對象。

3)如果拼接的字元串非常多,concat 的效率就會下降,因為創建的字元串對象越多,開銷就越大。

註意了!!!

弱弱地問一下啊,還有在用 JSP 的同學嗎?EL 表達式中是不允許使用“+”操作符來拼接字元串的,這時候就只能用 concat 了。

${chenmo.concat('-').concat(wanger)}

05、String 類的 join 方法

JDK 1.8 提供了一種新的字元串拼接姿勢:String 類增加了一個靜態方法 join。

String chenmo = "沉默";
String wanger = "王二";
String cmower = String.join("", chenmo, wanger);
System.out.println(cmower);

第一個參數為字元串連接符,比如說:

String message = String.join("-", "王二", "太特麽", "有趣了");

輸出結果為:王二-太特麽-有趣了

我們來看一下 join 方法的源碼:

public static String join(CharSequence delimiter, CharSequence... elements) {
    Objects.requireNonNull(delimiter);
    Objects.requireNonNull(elements);
    // Number of elements not likely worth Arrays.stream overhead.
    StringJoiner joiner = new StringJoiner(delimiter);
    for (CharSequence cs: elements) {
        joiner.add(cs);
    }
    return joiner.toString();
}

發現了一個新類 StringJoiner,類名看起來很 6,讀起來也很順口。StringJoiner 是 java.util 包中的一個類,用於構造一個由分隔符重新連接的字元序列。限於篇幅,本文就不再做過多介紹了,感興趣的同學可以去瞭解一下。

06、StringUtils.join

實戰項目當中,我們處理字元串的時候,經常會用到這個類——org.apache.commons.lang3.StringUtils,該類的 join 方法是字元串拼接的一種新姿勢。

String chenmo = "沉默";
String wanger = "王二";

StringUtils.join(chenmo, wanger);

該方法更善於拼接數組中的字元串,並且不用擔心 NullPointerException。

StringUtils.join(null)            = null
StringUtils.join([])              = ""
StringUtils.join([null])          = ""
StringUtils.join(["a", "b", "c"]) = "abc"
StringUtils.join([null, "", "a"]) = "a"

通過查看源碼我們可以發現,其內部使用的仍然是 StringBuilder。

public static String join(final Object[] array, String separator, final int startIndex, final int endIndex) {
    if (array == null) {
        return null;
    }
    if (separator == null) {
        separator = EMPTY;
    }

    final StringBuilder buf = new StringBuilder(noOfItems * 16);

    for (int i = startIndex; i < endIndex; i++) {
        if (i > startIndex) {
            buf.append(separator);
        }
        if (array[i] != null) {
            buf.append(array[i]);
        }
    }
    return buf.toString();
}

大家讀到這,不約而同會有這樣一種感覺:我靠(音要拖長),沒想到啊沒想到,字元串拼接足足有 6 種姿勢啊,晚上回到家一定要一一嘗試下。

07、給小菜一個答覆

我相信,小菜讀到我這篇文章的時候,他一定會明白為什麼阿裡巴巴不建議在 for 迴圈中使用”+”號操作符進行字元串拼接了。

來看兩段代碼。

第一段,for 迴圈中使用”+”號操作符。

String result = "";
for (int i = 0; i < 100000; i++) {
    result += "六六六";
}

第二段,for 迴圈中使用 append。

StringBuilder sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
    sb.append("六六六");
}

這兩段代碼分別會耗時多長時間呢?在我的 iMac 上測試出的結果是:

1)第一段代碼執行完的時間為 6212 毫秒

2)第二段代碼執行完的時間為 1 毫秒

差距也太特麽大了吧!為什麼呢?

我相信有不少同學已經有了自己的答案:第一段的 for 迴圈中創建了大量的 StringBuilder 對象,而第二段代碼至始至終只有一個 StringBuilder 對象。

08、最後

謝謝大家的閱讀,原創不易,喜歡就隨手點個贊

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • CSS CSS簡述 CSS是什麼?有什麼作用? CSS(Cascading Style Sheets):層疊樣式表。 CSS通常稱為CSS樣式或層疊樣式表。主要用於設置HTML頁面中的文本內容(字體、大小、對齊方式等)、圖片的外形(寬度、邊框樣式、邊距等)以及版式的佈局等外觀顯示樣式。 CSS可以使 ...
  • Mirror王宇陽 2019年11月13日 [首發] 數日沒有更新博文了,覺得不好意思了!這不是,整理了一下JavaScript的一下BOM筆記資料,今天貢獻出來!(HTML DOM也會隨後整理髮表) 筆者在接觸Js之前就聽聞Js的“牛逼”,接觸後發現只要想法夠賊,Js就能給你的賊想法復現 ~ 作者 ...
  • 2019.11.11 深圳千鋒H5前端學習筆記 ...
  • [TOC] form表單( ) 能夠獲取用戶輸入(輸入,選擇,上傳的文件) 參數 action 控制數據提交的地址 三種書寫方式 1.不寫 預設就是朝當前頁面所在的地址提交數據 2.寫全路徑(https://www.baidu.com) 3.只寫路徑尾碼( ) method 控制數據提交的方式 `f ...
  • 因為在IOS微信中在彈窗中使用input使鍵盤彈起,使彈窗的位置上移,當鍵盤關閉時頁面還在上面,彈窗位移量也在上面,只有下拉才能回到原位,這樣彈窗也消失了。我的處理辦法就是在鍵盤彈起和消失的時候,讓頁面都回到彈起之前的狀態,使用了window.scrollTo方法。 keyUpClose () { ...
  • TCP三次握手和四次揮手 TCP有6種標示:SYN(建立聯機) ACK(確認) PSH(傳送) FIN(結束) RST(重置) URG(緊急) 一、TCP三次握手 第一次握手 客戶端向伺服器發出連接請求報文,這時報文首部中的同部位SYN=1,同時隨機生成初始序列號 seq=x,此時,TCP客戶端進程 ...
  • 1、Content Type 的值類型: 1.1 application/json:消息主體是序列化後的 JSON 字元串 1.2 application/x www form urlencoded:數據被編碼為名稱/值對。這是標準的編碼格式 1.3 multipart/form data: 需要在 ...
  • 一、視頻列表中控制只允許一個視頻播放 註: call() :調用一個對象的一個方法,用另一個對象替換當前對象,例如: arrayA.call(A,args1,args2) ,即 A 對象調用 arrayA 對象的方法。 二、視頻列表播放時滑動頁面抖動 註 : app 預設最小高度: min heig ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...