記一次 .NET某上位機視覺程式 卡死分析

来源:https://www.cnblogs.com/huangxincheng/p/18413420
-Advertisement-
Play Games

一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...


一:背景

1. 講故事

前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。

二:WinDbg 分析

1. 為什麼會卡死

窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrstack 看下主線程,輸出如下:


0:000> !clrstack
OS Thread Id: 0x3118 (0)
        Child SP               IP Call Site
000000c478afd1d8 00007ffc284e9a84 [HelperMethodFrame_1OBJ: 000000c478afd1d8] System.Threading.WaitHandle.WaitOneNative(System.Runtime.InteropServices.SafeHandle, UInt32, Boolean, Boolean)
000000c478afd300 00007ffbf2cc19ac System.Threading.WaitHandle.InternalWaitOne(System.Runtime.InteropServices.SafeHandle, Int64, Boolean, Boolean) [f:\dd\ndp\clr\src\BCL\system\threading\waithandle.cs @ 243]
000000c478afd330 00007ffbf2cc197f System.Threading.WaitHandle.WaitOne(Int32, Boolean) [f:\dd\ndp\clr\src\BCL\system\threading\waithandle.cs @ 194]
000000c478afd370 00007ffbf1421904 System.Windows.Forms.Control.WaitForWaitHandle(System.Threading.WaitHandle)
000000c478afd3e0 00007ffbf0c8e2f4 System.Windows.Forms.Control.MarshaledInvoke(System.Windows.Forms.Control, System.Delegate, System.Object[], Boolean)
000000c478afd520 00007ffbf1425124 System.Windows.Forms.Control.Invoke(System.Delegate, System.Object[])
000000c478afd590 00007ffb995d6fe8 DevComponents.DotNetBar.StyleManager.OnColorTintChanged(System.Drawing.Color, System.Drawing.Color)
000000c478afd5f0 00007ffb995d69ff DevComponents.DotNetBar.StyleManager.set_ColorTint(System.Drawing.Color)
000000c478afd680 00007ffb995d694c DevComponents.DotNetBar.StyleManager.set_ManagerColorTint(System.Drawing.Color)
...
000000c478afd6b0 00007ffb995d50f9 xxx.MarkInspectPadControl.InitializeComponent()

有經驗的朋友看到上面的卦象相信就知道咋事情了,即有工作線程創建了用戶控制項導致的,而且這個控制項貌似和 DevComponents 有關,接下來的常規套路就是挖一下 WindowsFormsSynchronizationContext 對象看看到底是哪一個線程創建的,使用 !dso 即可。


0:000> !dso
OS Thread Id: 0x3118 (0)
RSP/REG          Object           Name
000000C478AFCF98 000002093b9143c0 System.Windows.Forms.WindowsFormsSynchronizationContext
...
0:000> !do poi(20939c91588)
Name:        System.Threading.Thread
MethodTable: 00007ffbf2769580
EEClass:     00007ffbf288c658
Size:        96(0x60) bytes
00007ffbf276aaf8  4001934       4c         System.Int32  1 instance                1 m_ManagedThreadId

按照劇本的話 WindowsFormsSynchronizationContext 應該會有2個,但這裡只有1個,這一個還是主線程的同步上下文,這就完犢子了。。。完全不按照劇本走,這也是真實dump分析的複雜性,那到底是誰創建的呢? 天要絕人之路嗎?

2. 出路在哪裡

所有東西的落地都在彙編里,而彙編又在方法里,所以突破口就是尋找線程棧中的方法,接下來到 System.Windows.Forms.Control.MarshaledInvoke 方法里看一看可有什麼大貨,簡化後如下:


private object MarshaledInvoke(Control caller, Delegate method, object[] args, bool synchronous)
{
    bool flag = false;
    if (SafeNativeMethods.GetWindowThreadProcessId(new HandleRef(this, Handle), out var _) == SafeNativeMethods.GetCurrentThreadId() && synchronous)
    {
        flag = true;
    }
    ThreadMethodEntry threadMethodEntry = new ThreadMethodEntry(caller, this, method, args, synchronous, executionContext);
    lock (threadCallbackList)
    {
        if (threadCallbackMessage == 0)
        {
            threadCallbackMessage = SafeNativeMethods.RegisterWindowMessage(Application.WindowMessagesVersion + "_ThreadCallbackMessage");
        }
        threadCallbackList.Enqueue(threadMethodEntry);
    }
    if (flag)
    {
        InvokeMarshaledCallbacks();
    }
    else
    {
        UnsafeNativeMethods.PostMessage(new HandleRef(this, Handle), threadCallbackMessage, IntPtr.Zero, IntPtr.Zero);
    }
    if (synchronous)
    {
        if (!threadMethodEntry.IsCompleted)
        {
            WaitForWaitHandle(threadMethodEntry.AsyncWaitHandle);
        }
        return threadMethodEntry.retVal;
    }
    return threadMethodEntry;
}

從卦中的代碼來看,這個 SafeNativeMethods.GetWindowThreadProcessId 方法是關鍵,它可以拿到這個視窗創建的processidthreadid,接下來觀察下簡化後的彙編代碼。


0:000> !U /d 00007ffbf0c8e2f4
preJIT generated code
System.Windows.Forms.Control.MarshaledInvoke(System.Windows.Forms.Control, System.Delegate, System.Object[], Boolean)
Begin 00007ffbf0c8dec0, size 4e9
00007ffb`f0c8dec0 55              push    rbp
00007ffb`f0c8dec1 4157            push    r15
00007ffb`f0c8dec3 4156            push    r14
00007ffb`f0c8dec5 4155            push    r13
00007ffb`f0c8dec7 4154            push    r12
00007ffb`f0c8dec9 57              push    rdi
00007ffb`f0c8deca 56              push    rsi
00007ffb`f0c8decb 53              push    rbx
00007ffb`f0c8decc 4881ecf8000000  sub     rsp,0F8h
00007ffb`f0c8ded3 488dac2430010000 lea     rbp,[rsp+130h]
...
00007ffb`f0c8dff0 488d55b0        lea     rdx,[rbp-50h]
00007ffb`f0c8dff4 ff151e1eddff    call    qword ptr [System_Windows_Forms_ni+0x8fe18 (00007ffb`f0a5fe18)] (System.Windows.Forms.SafeNativeMethods.GetWindowThreadProcessId(System.Runtime.InteropServices.HandleRef, Int32 ByRef), mdToken: 00000000060033c4)
00007ffb`f0c8dffa 448bf0          mov     r14d,eax

根據卦中的彙編以及x64調用協定,lea rdx,[rbp-50h] 就是我們的 processid,同時 mov r14d,eax 中的 r14d 就是我們的 threadid,突破口已找到,接下來就是深挖了。

3. 如何挖出進程ID和線程ID

有一點要知道 000000c478afd520 和 MarshaledInvoke 方法的 rsp 隔了一個 0x8,同時方法中影響 rsp 的 push 和 sub 都要計算進去,這裡就不贅述了,具體可以參考文章:https://www.cnblogs.com/huangxincheng/p/17250240.html 簡單計算後如下:


0:000> ? 000000c478afd520-0x8-(0n8*0n8)-0xF8+0x130
Evaluate expression: 843838379280 = 000000c4`78afd510
0:000> dp 000000c4`78afd510-0x50 L1
000000c4`78afd4c0  00000000`000029dc

0:000> r r14
r14=000000c478afcf14
0:000> dp 000000c478afcf14 L1
000000c4`78afcf14  00000000`00000080

從卦中可以看到 processid=29dc ,threadid=0x80,這東西是何方神聖呢,我們用 ~ 來找它的真身吧。

0:000> ~
...
  18  Id: 29dc.80 Suspend: 0 Teb: 000000c4`7890d000 Unfrozen
...

0:018> k
 # Child-SP          RetAddr               Call Site
00 000000c4`7a2ffcc8 00007ffc`28028ba3     ntdll!NtWaitForSingleObject+0x14
01 000000c4`7a2ffcd0 00007ffb`fa651cf8     KERNELBASE!WaitForSingleObjectEx+0x93
02 000000c4`7a2ffd70 00007ffb`fa652a51     wpfgfx_v0400!CPartitionManager::GetWork+0x17b
03 000000c4`7a2ffdc0 00007ffb`fa67a2fb     wpfgfx_v0400!CPartitionThread::Run+0x21
04 000000c4`7a2ffdf0 00007ffc`2a037bd4     wpfgfx_v0400!CPartitionThread::ThreadMain+0x2b
05 000000c4`7a2ffe20 00007ffc`2a76ced1     kernel32!BaseThreadInitThunk+0x14
06 000000c4`7a2ffe50 00000000`00000000     ntdll!RtlUserThreadStart+0x21

現在有點傻傻分不清了,怎麼 winform 里還有 wpf 的渲染線程,有可能是 DevComponents 這種第三方控制項在底層引入的吧。到這裡路子又被堵死了,接下來該往哪裡走呢?三步一回頭,繼續看主線程上的方法代碼吧。

4. 在源碼中尋找答案

雖然在兩條路上的突圍都失敗了,但可以明顯的看到離真相真的越來越近,也收穫到了大量的作戰信息,通過上面的 set_ManagerColorTint 方法的反編譯,參考如下:


private void InitializeComponent()
{
    this.styleManager1.ManagerColorTint = System.Drawing.Color.Black;
}

[Description("Indicates color current style is tinted with.")]
[Category("Appearance")]
public Color ManagerColorTint
{
    get
    {
        return ColorTint;
    }
    set
    {
        ColorTint = value;
    }
}

看到源碼之後太無語了,其實就是一個簡單的 顏色賦值,根據前面的探索styleManager1是由渲染線程創建的,所以主線程對它的賦值自然是得不到渲染線程的反饋。

那這個問題該怎麼辦呢?大概是如下兩種吧。

  1. 重點關註 styleManager1 控制項,用排除法觀察程式運行狀況。
  2. 看文檔是否用了錯誤的方式使用 styleManager1 控制項。

三:總結

這次生產事故還是挺有意思的,為什麼 WinForm 中可以存在 CPartitionThread 渲染線程,最後還禍在其身,給我幾百例dump分析之旅中添加了一筆色彩!

圖片名稱
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文並不討論“延遲初始化”或者是“懶載入的單例”那樣的東西,本文要討論的是分配某一類型所需的空間後不對類型進行構造(即對象的lifetime沒有開始),更通俗點說,就是跳過對象的構造函數執行。 使用場景 我們知道,不管是定義某個類型的對象還是用operator new申請記憶體,對象的構造函數都是會立 ...
  • 在多人協作的軟體開發項目中,Git 衝突是不可避免的現象。當兩個或更多的開發者同時修改了同一段代碼,並且嘗試將這些修改合併到一起時,衝突就發生了。解決這些衝突是確保代碼庫健康和項目順利進行的關鍵。 ...
  • 1. 本網站的系統架構 2. 場景概述 3. 影響效率的問題和解決方案 3.1. 圖片插入-根據文章來分類管理 3.1.1. 效率問題 3.1.2. 解決方案 3.2. 圖片插入-從剪貼板中插入圖片 3.2.1. 效率問題 3.2.2. 解決方案 3.3. 圖片插入-在VSCode中預覽圖片 3.3 ...
  • 題目描述 給你一個二叉樹的根節點 root ,按 任意順序 ,返回所有從根節點到葉子節點的路徑。 葉子節點 是指沒有子節點的節點。 解題思路 這道題我們採用二叉樹里的前序遍歷方式,我們要遍歷所有到葉子節點的路徑,我們採用復用的思想,就是讓這裡的幾個數據結構我們可以重覆使用,但是重覆使用也就帶來數據不 ...
  • 在現代應用程式中,星級評分是一個常見的用戶界面元素,它允許用戶對產品、服務或內容進行評價。 想必大家在用各種帶有評分的軟體中看到過這個組件: 本文將指導你如何使用 Qml 創建一個簡單而美觀的星級評分組件,並且支持高度自定義。 ...
  • 在WPF開發中,經常會需要用到UI控制項的2D轉換(如:旋轉,縮放,移動,傾斜等功能),本文以一些簡單的小例子,簡述如何通過Transform類實現FrameworkElement對象的2D轉換,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 一:背景 講故事 公司部署在某碟上的項目在9月份壓測50併發時,發現某個容器線程、記憶體非正常的上漲,導致功能出現了異常無法使用。根據所學,自己分析了下線程和記憶體問題,分析時可以使用lldb或者windbg,但是個人比較傾向於界面化的windbg,所以最終使用windbg開乾。 二:WinDbg 分析 ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...