記一次 .NET 某工控軟體 記憶體泄露分析

来源:https://www.cnblogs.com/huangxincheng/archive/2022/12/06/16954300.html
-Advertisement-
Play Games

一:背景 1.講故事 上個月 .NET調試訓練營 里的一位老朋友給我發了一個 8G 的dump文件,說他的程式記憶體泄露了,一時也沒找出來是哪裡的問題,讓我幫忙看下到底是怎麼回事,畢竟有了一些調試功底也沒分析出來,說明還是有一點複雜的,現實世界中的dump遠比課上說的複雜的多。 還是那句話,找我分析是 ...


一:背景

1.講故事

上個月 .NET調試訓練營 里的一位老朋友給我發了一個 8G 的dump文件,說他的程式記憶體泄露了,一時也沒找出來是哪裡的問題,讓我幫忙看下到底是怎麼回事,畢竟有了一些調試功底也沒分析出來,說明還是有一點複雜的,現實世界中的dump遠比課上說的複雜的多。

還是那句話,找我分析是免費的,沒有某軟高額的工時費,接下來我們上 WinDbg 說話。

二:WinDbg 分析

1. 托管還是非托管泄露

這是我們首先就要做出的抉擇,否則就會南轅北轍,可以使用 !address -summary & !eeheap -gc 來定位一下。


0:000> !address -summary

--- Usage Summary ---------------- RgnCount ----------- Total Size -------- %ofBusy %ofTotal
Free                                   1311     7ffc`e2b37000 ( 127.988 TB)           99.99%
<unknown>                              4799        2`4f798000 (   9.242 GB)  74.19%    0.01%
Heap                                   3029        0`906fe000 (   2.257 GB)  18.12%    0.00%
Image                                  3435        0`2b530000 ( 693.188 MB)   5.43%    0.00%
Stack                                   226        0`11e00000 ( 286.000 MB)   2.24%    0.00%
Other                                    90        0`0025c000 (   2.359 MB)   0.02%    0.00%
TEB                                      75        0`00096000 ( 600.000 kB)   0.00%    0.00%
PEB                                       1        0`00001000 (   4.000 kB)   0.00%    0.00%

--- Type Summary (for busy) ------ RgnCount ----------- Total Size -------- %ofBusy %ofTotal
MEM_PRIVATE                            7990        2`e6964000 (  11.603 GB)  93.14%    0.01%
MEM_IMAGE                              3445        0`2b536000 ( 693.211 MB)   5.43%    0.00%
MEM_MAPPED                              220        0`0b61f000 ( 182.121 MB)   1.43%    0.00%

--- State Summary ---------------- RgnCount ----------- Total Size -------- %ofBusy %ofTotal
MEM_FREE                               1311     7ffc`e2b37000 ( 127.988 TB)           99.99%
MEM_COMMIT                             8158        1`cf52a000 (   7.239 GB)  58.11%    0.01%
MEM_RESERVE                            3497        1`4df8f000 (   5.218 GB)  41.89%    0.00%

0:000> !eeheap -gc
Number of GC Heaps: 1
generation 0 starts at 0x0000023ba303e940
generation 1 starts at 0x0000023ba2ebd0d0
generation 2 starts at 0x00000239a80f1000
ephemeral segment allocation context: none
...
Large object heap starts at 0x00000239b80f1000
         segment             begin         allocated              size
00000239b80f0000  00000239b80f1000  00000239bfe174a8  0x7d264a8(131228840)
0000023a6f050000  0000023a6f051000  0000023a73780800  0x472f800(74643456)
Total Size:              Size: 0xea9878f8 (3935860984) bytes.
------------------------------
GC Heap Size:            Size: 0xea9878f8 (3935860984) bytes.

從卦中的 MEM_COMMITGC Heap Size 這兩個指標來看,主要還是托管記憶體泄露,雖然非托管記憶體也不小,大概率還是托管這邊導致的,有了這些信息之後,後面就是看下 托管堆 到底都是些什麼對象。


0:000> !dumpheap -stat
Statistics:
              MT    Count    TotalSize Class Name
...
00007ffa2d7a1080  4923008    118152192 System.WeakReference
00007ffa2d725e70  2224022    125834760 System.Object[]
00007ffa2701de10  1044218    133659904 System.Windows.Documents.Paragraph
00007ffa2706b470  1045023    142123128 System.Windows.Documents.Run
00007ffa2706a9b0  2098480    151090560 System.Windows.Documents.TextTreeTextNode
00007ffa2d7267d0  1138661    159949302 System.Char[]
00007ffa2d7259c0  1231039    160962948 System.String
00007ffa29580cd8      214    165608376 MS.Internal.WeakEventTable+EventKey[]
00007ffa2d729750  2116556    169324480 System.Collections.Hashtable
00007ffa2d724478  2117718    209740224 System.Collections.Hashtable+bucket[]
00007ffa2706eb08  4175733    367464504 System.Windows.Documents.TextTreeTextElementNode
00007ffa2700ca48  2088016    384194944 System.Windows.ResourceDictionary
00007ffa2957fdc8  2344569    405666920 System.Windows.EffectiveValueEntry[]              

從卦中的 TotalSize 來看並沒有明顯的特征,但從 Count 看還是有一些蛛絲馬跡的,比如 System.Windows.Documents.TextTreeTextElementNode 對象為什麼高達 417w ? 為什麼 System.Windows.Documents.TextTreeTextNode209w ? 雖然都是 WPF 框架的內部類,但從名字上看貌似和 文本類 控制項有關係。

2. TextTreeTextElementNode 為什麼沒被回收

有了這些可疑信息,接下來就需要看下他們為什麼沒有被 GC 收掉?要想找到答案就需要抽幾個 TextTreeTextElementNode 看下用戶根是什麼?可以使用 !dumpheap -mt xxx 找到 address 之後再用 !gcroot 觀察一下。


0:000> !dumpheap -mt 00007ffa2706eb08
         Address               MT     Size
00000239a815f028 00007ffa2706eb08       88
00000239a815f080 00007ffa2706eb08       88     
00000239a815f2e8 00007ffa2706eb08       88     
00000239a815f340 00007ffa2706eb08       88     
00000239a8259f18 00007ffa2706eb08       88  
...

0:000>  !gcroot 0000023a637180e0
 !gcroot 0000023a637180e0
Thread e6c:
    000000aebe7fec20 00007ffa296c0298 System.Windows.Threading.Dispatcher.GetMessage(System.Windows.Interop.MSG ByRef, IntPtr, Int32, Int32)
        rsi: 
            ->  00000239a8101688 System.Windows.Threading.Dispatcher
            ->  0000023b4630e9a8 System.EventHandler
            ->  0000023b4630a990 System.Object[]
            ->  00000239a8425648 System.EventHandler
                ...

結果刷了半天都沒刷完,還把 windbg 給弄死了,看樣子這個引用鏈得有幾十萬哈。。。截圖如下:

那遇到這種情況怎麼辦呢? 為了能夠記錄到所有的引用鏈,大家可以用 windbg 的 .logopen.logclose 命令將所有的輸出記錄到文本中,喝了杯咖啡之後,終於output完了,看文件有 81w 行,真的心累。

一眼望去大多是 TextTreeTextElementNode 和 TextTreeFixupNode 之間的交叉引用,還得耐點心慢慢往上翻,看看可有什麼蛛絲馬跡,經過仔細排查,發現有一個 RickTextBox 控制項,截圖如下:

從名字上來看,可能是想用 RichTextBox 記錄日誌,接下來看下 OperatorLogItemRichTextBox 這個類是怎麼寫的。


public sealed class OperatorLogItemRichTextBox : RichTextBox, IOperatorLogger
{
    private static readonly DependencyProperty MaximumLogCountProperty = DependencyProperty.Register("MaximumLogCount", typeof(int), typeof(OperatorLogItemRichTextBox), new PropertyMetadata(1024));

    private static readonly DependencyProperty VerboseBrushProperty = DependencyProperty.Register("VerboseBrush", typeof(Brush), typeof(OperatorLogItemRichTextBox), new PropertyMetadata(Brushes.Gray));

    private static readonly DependencyProperty DebugBrushProperty = DependencyProperty.Register("DebugBrush", typeof(Brush), typeof(OperatorLogItemRichTextBox), new PropertyMetadata(Brushes.Cyan));

    ...

    private static readonly DependencyProperty ExceptionBrushProperty = DependencyProperty.Register("ExceptionBrush", typeof(Brush), typeof(OperatorLogItemRichTextBox), new PropertyMetadata(Brushes.Magenta));

    private static readonly DependencyProperty SpecialBrushProperty = DependencyProperty.Register("SpecialBrush", typeof(Brush), typeof(OperatorLogItemRichTextBox), new PropertyMetadata(Brushes.Magenta));

    ...
}

從源碼看,朋友在項目中實現了一個自定義的 RichTextBox 控制項來實現日誌記錄,記憶體泄露問題應該就在這裡。

有車的朋友都知道 4S 店有一個好的傳統,那就是 只換不修,又簡單又能輕鬆掙錢,所以我給朋友的建議是:把 OperatorLogItemRichTextBox 從項目中給踢掉,排查下還有沒有記憶體泄露的問題。

終於在一周後,收到了朋友的反饋,問題也終於解決了,截圖如下:

三: 總結

其實關於 RichTextBox 的問題我遇到過二次,上次是崩潰相關的,如果要用它來記錄日誌,建議還是用信得過的第三方富文本控制項,自己實現的話,難免會踩到很多坑。

圖片名稱
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 介面優化過程記錄 問題背景 某個介面耗時長(247ms),但裡面邏輯不算複雜,只進行了簡單的對象引用以及操作了多次Redis 步驟1:鏈路追蹤,確定業務耗時點 介面里通過鏈路追蹤以及日誌查詢發現主要是操作Redis的這條鏈路耗時變長 步驟2:從Redis找問題,列出可能點 原因可能是: Redis本 ...
  • Map的常用方法 案例1 場景:一張建行用戶體驗金信息大表(百萬級別),裡面存在一個欄位對多條數據,需要統計某個欄位的多條數據累加值以供於別的服務調用。 優化前解決:直接查出來一個大list給到另一個服務,再另外一個服務里有笛卡爾積算出累加值(笛卡爾積後得到jvm需運算56億次),程式直接接近崩潰, ...
  • JZ34 二叉樹中和為某一值的路徑(二) 描述 輸入一顆二叉樹的根節點root和一個整數expectNumber,找出二叉樹中結點值的和為expectNumber的所有路徑。 1.該題路徑定義為從樹的根結點開始往下一直到葉子結點所經過的結點 2.葉子節點是指沒有子節點的節點 3.路徑只能從父節點到子 ...
  • 上線流程 上線前準備 首先將跑在本地版本的項目,上傳至遠端(gitee、github上) 重新複製一份項目的配置文件,可以命名為pro.py(dev為開發階段的配置文件,pro為上線的配置文件) 在pro文件內,修改以下配置項: # 將調式模式改為false DEBUG = False # 運行的h ...
  • Redis數據結構 1. SDS Redis 是用 C 語言寫的,但是對於 Redis 的字元串,卻不是 C 語言中的字元串(即以空字元’\0’結尾的字元數組),它是自己構建了一種名為 簡單動態字元串(simple dynamic string,SDS)的抽象類型,並將 SDS 作為 Redis 的 ...
  • 本文使用Python實現『顏色提取』功能,構建『簡單提取器』與『複雜提取器』,從單個或多個圖像的某個位置提取顏色,類似PS或者PPT中的取色器功能。 ...
  • 題目大意 有 $3$ 個門,有兩個門後面會有一個鑰匙,你現在手中有一把鑰匙,問你能不能打開所有的門。 題目分析 我們可以一步一步推導,既然給了我們一把鑰匙編號為 $x$,也就是可以打開編號為 $x$ 的門,我們用 $a_x$ 表示這扇門後面鑰匙的編號,將可以打開的門標記起來,然後產生分類討論: 如果 ...
  • 正確使用 HttpClient 使用 HttpClient 註意事項 HttpClient預設最大併發連接數是2 本機測試(被請求的WebApi部署在本機)HttpClient不會被限制最大併發連接數 使用HttpClient要寫個工廠類,因為HttpClient不能頻繁創建 HttpClient類 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...