非常簡單的string駐留池,你對它真的瞭解嗎

来源:https://www.cnblogs.com/huangxincheng/archive/2020/04/29/12799736.html
-Advertisement-
Play Games

昨天看群里在討論C 中的string駐留池,炒的火熱,幾輪下來理論一堆堆,但是在證據提供上都比較尷尬。雖然這東西很基礎,但比較好的回答也不是那麼容易,這篇我就以我能力範圍之內跟大家分享一下 一:無處不在的池 開發這麼多年,相信大家對‘池’ 這個概念都耳熟能詳了,連接池,線程池,對象池,還有這裡的駐留 ...


昨天看群里在討論C#中的string駐留池,炒的火熱,幾輪下來理論一堆堆,但是在證據提供上都比較尷尬。雖然這東西很基礎,但比較好的回答也不是那麼容易,這篇我就以我能力範圍之內跟大家分享一下

一:無處不在的池

開發這麼多年,相信大家對‘池’ 這個概念都耳熟能詳了,連接池,線程池,對象池,還有這裡的駐留池,池的存在就是為了復用為了共用,獨樂樂不如眾樂樂,畢竟一個字元串的生成和銷毀既浪費空間又浪費時間,還不如先養著。

1. 說說現象

通常我們臆想中是這麼認為的,定義幾個字元串變數,堆上就會分配幾個string對象,其實這底層有一種叫駐留池技術可以做到如果兩個字元串內容相同,那就在堆上只分配一個string對象,然後將引用地址分配給兩個字元串變數,這樣就可以大大降低了記憶體使用,如果用代碼表示就是下麵這樣。


        public static void Main(string[] args)
        {
            var str1 = "nihao";
            var str2 = "nihao";

            var b = string.ReferenceEquals(str1, str2);
            Console.WriteLine(b);
        }

----------- output -----------
True

2. 實現原理

那怎麼做到的呢? 其實CLR在運行時調用JIT把你的MSIL代碼轉成機器代碼的時候會發現你的元數據中定義了相同內容的字元串對象,CLR就會把你的字元串放入它私有的的內部字典中,其中key就是字元串內容,value就是分配在堆上的字元串引用地址,這個字典就是所謂的駐留池,如果不是很明白,我來畫一張圖。

3. windbg驗證

可以用windbg看一下棧中的str1和str2是否都指向了堆上對象的地址。

~0s -> !clrstack -l 在主線程的線程棧上找到變數str1和str2


0:000> ~0s
ntdll!ZwReadFile+0x14:
00007ff8`fea4aa64 c3              ret
0:000> !clrstack -l
OS Thread Id: 0x1c1c (0)
        Child SP               IP Call Site

000000ac0b7fed00 00007ff889e608e9 *** WARNING: Unable to verify checksum for ConsoleApp2.exe
ConsoleApp2.Program.Main(System.String[]) [C:\dream\Csharp\ConsoleApp1\ConsoleApp2\Program.cs @ 30]
    LOCALS:
        0x000000ac0b7fed38 = 0x0000024a21f22d48
        0x000000ac0b7fed30 = 0x0000024a21f22d48

000000ac0b7fef48 00007ff8e9396c93 [GCFrame: 000000ac0b7fef48] 

從上面代碼的 LOCALS 的 0x000000ac0b7fed38 = 0x0000024a21f22d480x000000ac0b7fed30 = 0x0000024a21f22d48可以看到兩個局部變數的引用地址都是 0x0000024a21f22d48,說明指向的都是一個堆對象,接下來再把堆上的內容打出來。


0:000> !do 0x0000024a21f22d48
Name:        System.String
MethodTable: 00007ff8e7a959c0
EEClass:     00007ff8e7a72ec0
Size:        36(0x24) bytes
File:        C:\WINDOWS\Microsoft.Net\assembly\GAC_64\mscorlib\v4.0_4.0.0.0__b77a5c561934e089\mscorlib.dll
String:      nihao
Fields:
              MT    Field   Offset                 Type VT     Attr            Value Name
00007ff8e7a985a0  4000281        8         System.Int32  1 instance                5 m_stringLength
00007ff8e7a96838  4000282        c          System.Char  1 instance               6e m_firstChar
00007ff8e7a959c0  4000286       d8        System.String  0   shared           static Empty
                                 >> Domain:Value  0000024a203d41c0:NotInit  <<

可以看到,果然是System.String對象,這就和我的圖是相符的。

二 駐留池的驗證

1. String下的駐留池驗證方法

很遺憾的是水平有限,由於駐留池既不在堆中也不在棧上,目前還不知道怎麼用windbg去列印CLR中駐留池字典內容,不過也可以通過 string.Intern 去驗證。

        //
        // Summary:
        //     Retrieves the system's reference to the specified System.String.
        //
        // Parameters:
        //   str:
        //     A string to search for in the intern pool.
        //
        // Returns:
        //     The system's reference to str, if it is interned; otherwise, a new reference
        //     to a string with the value of str.
        //
        // Exceptions:
        //   T:System.ArgumentNullException:
        //     str is null.
        [SecuritySafeCritical]
        public static String Intern(String str);

從註釋中可以看到,這個方法的意思就是:如果你定義的str在駐留池中存在,那麼就返回駐留池中命中內容的堆上引用地址,如果不存在,將新字元串插入駐留池中再返回堆上引用,先上一下代碼:


        public static void Main(string[] args)
        {
            var str1 = "nihao";
            var str2 = "nihao";

            //驗證nihao是否在駐留池中,如果存在那麼str3 和 str1,str2一樣的引用
            var str3 = string.Intern("nihao");

            //驗證新的字元串內容是否進入駐留池中
            var str4 = string.Intern("cnblogs");
            var str5 = string.Intern("cnblogs");

            Console.ReadLine();
        }

接下來分別驗證一下str3是否也是和str1和str2一樣的引用,以及str5是否存在駐留池中。


ConsoleApp2.Program.Main(System.String[]) [C:\dream\Csharp\ConsoleApp1\ConsoleApp2\Program.cs @ 37]
    LOCALS:
        0x00000047105fea58 = 0x0000018537312d48
        0x00000047105fea50 = 0x0000018537312d48
        0x00000047105fea48 = 0x0000018537312d48
        0x00000047105fea40 = 0x0000018537312d70
        0x00000047105fea38 = 0x0000018537312d70

從五個變數地址中可以看到,nihao已經被str1,str2,str3共用,cnblogs也進入了駐留池中實現了共用。

2. 運行期相同string是否進入駐留池

這裡面有一個坑,前面討論的相同字元串都是在編譯期就知道的,但運行時中的相同字元串是否也會進入駐留池呢? 這是一個讓人充滿好奇的話題,可以試一下,在程式運行時接受IO輸入內容hello,看看是否和str1,str2共用引用地址。


        public static void Main(string[] args)
       {
           var str1 = "nihao";
           var str2 = "nihao";

           var str3 = Console.ReadLine();

           Console.WriteLine("輸入完成!");
           Console.ReadLine();
       }

0:000> !clrstack -l
000000f6d35fee50 00007ff889e7090d *** WARNING: Unable to verify checksum for ConsoleApp2.exe
ConsoleApp2.Program.Main(System.String[]) [C:\dream\Csharp\ConsoleApp1\ConsoleApp2\Program.cs @ 33]
   LOCALS:
       0x000000f6d35fee98 = 0x000002cb1a552d48
       0x000000f6d35fee90 = 0x000002cb1a552d48
       0x000000f6d35fee88 = 0x000002cb1a555f28
0:000> !do 0x000002cb1a555f28
Name:        System.String
MethodTable: 00007ff8e7a959c0
EEClass:     00007ff8e7a72ec0
Size:        36(0x24) bytes
File:        C:\WINDOWS\Microsoft.Net\assembly\GAC_64\mscorlib\v4.0_4.0.0.0__b77a5c561934e089\mscorlib.dll
String:      nihao
Fields:
             MT    Field   Offset                 Type VT     Attr            Value Name
00007ff8e7a985a0  4000281        8         System.Int32  1 instance                5 m_stringLength
00007ff8e7a96838  4000282        c          System.Char  1 instance               6e m_firstChar
00007ff8e7a959c0  4000286       d8        System.String  0   shared           static Empty
                                >> Domain:Value  000002cb18ad39f0:NotInit  <<


從上面內容可以看到,從Console.ReadLine接收到的引用地址是 0x000002cb1a555f28 ,雖然是相同內容,但卻沒有使用駐留池,這是因為駐留池在JIT靜態解析期就已經解析完成了,也就無法享受復用之優,如果還想復用的話,在 Console.ReadLine() 包一層 string.Intern即可,如下所示:


        public static void Main(string[] args)
        {
            var str1 = "nihao";
            var str2 = "nihao";

            var str3 = string.Intern(Console.ReadLine());

            Console.WriteLine("輸入完成!");
            Console.ReadLine();
        }

ConsoleApp2.Program.Main(System.String[]) [C:\dream\Csharp\ConsoleApp1\ConsoleApp2\Program.cs @ 33]
    LOCALS:
        0x0000008fac1fe9c8 = 0x000001ff46582d48
        0x0000008fac1fe9c0 = 0x000001ff46582d48
        0x0000008fac1fe9b8 = 0x000001ff46582d48

可以看到這個時候str1,str2,str3共用一個記憶體地址 0x000001ff46582d48

四: 總結

駐留池技術是個很

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、基礎知識 1.1、Dapper簡介 Dapper是.NET下的一個micro ORM,它和Entity Framework或NHibnate不同,屬於輕量級並且是半自動的(實體類都要自己寫)。假如你喜歡原生的Sql語句,又喜歡ORM的簡單,那你一定會喜歡上Dapper這款ORM。 1.2、Dap ...
  • Web API 約定 預設的約定 集將應用於 ContactsConventionController 中的所有操作: 預設的約定集將應用於程式集中的所有操作: 創建 Web API 約定 如果預設 API 約定不能滿足需要,請創建自己的約定。 約定是: 帶有方法的靜態類型。 能夠對操作定義 "響應 ...
  • 前言 System.Timers.Timer組件是基於伺服器的計時器,它能夠指定在應用程式中引發Elapsed事件周期性間隔,以處理相應事件。 使用示例: 運行結果展示: System.Timers.Timer屬性、方法解讀: 1)預設100毫秒觸發一次Elapsed事件,可通過其屬性Interva ...
  • 1.同步與非同步 假設存在 IO事件A:請求網路資源 (完成耗時5s) IO事件B:查詢資料庫 (完成耗時5s) 情況一:線程1工人在發起A請求後,一直阻塞等待,在A響應返回結果後再接著處理事件B,那總共需要耗時>10s. 情況二:線程1工人在發起A請求後,馬上返回發起B請求然後返回,5s後事件A響應 ...
  • learun是什麼 learun是一款.net WEB應用軟體快速開發平臺,主要服務於軟體企業和傳統行業企事業單位信息中心的開發人員,為他們提供一套完整的.net WEB應用軟體快速開發解決方案。 平臺包括如下幾個部分: 1、learun平臺集成環境:learun開發平臺是一個集成開發環境,在此集成 ...
  • 目前一直在用policy做許可權校驗,但是好像組裡需要將返回結果統一,之前用的都是直接繼承AuthorizationHandler然後調用context.Fail(),但是這樣會導致沒辦法自定義返回結果比如{code:403,msg:'未授權',data:null}, 也百度了下https://q.c ...
  • 最近被安排開發文件存儲微服務,要求是能夠通過配置來無縫切換我們公司內部研發的文件存儲系統,FastDFS,MongDb GridFS,阿裡雲OSS,騰訊雲OSS等。根據任務緊急度暫時先完成了通過配置來無縫切換內部文件系統以及FastDFS。至於MongDb GridFS,阿裡雲OSS,騰訊雲OSS等 ...
  • 大部分在 Windows 下的腳本都是使用 bat 或 cmd 寫的,這部分的腳本對我來說可讀性不好。這個可讀性也是很主觀的,對我來說用 C# 寫腳本的可讀性很強,但是換個小伙伴就不是了。在 .NET Core 下的 C# 可以通過 dotnet run 運行代碼起來,此時特別適合用來寫腳本 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...