一次k8s docker下.net程式的異常行為dump診斷

来源:https://www.cnblogs.com/dotnet-diagnostic/archive/2023/02/28/17153844.html
-Advertisement-
Play Games

背景 昨天,一位朋友找到我尋求幫助。他的項目需要調用一個第三方項目的webAPI。這個webAPI本身可從header, query string中取相關信息,但同事發現他在調用時,無法按期望的那樣從query string中傳參數給到第三方webAPI (webAPI仿佛忽略了從query str ...


背景

昨天,一位朋友找到我尋求幫助。他的項目需要調用一個第三方項目的webAPI。這個webAPI本身可從header, query string中取相關信息,但同事發現他在調用時,無法按期望的那樣從query string中傳參數給到第三方webAPI (webAPI仿佛忽略了從query string過來的信息),朋友不知道是這個webAPI的問題,還是自己調用代碼的問題了。。

由於這個webAPI service是他們公司內部的某team的項目,所以朋友雖然可以看到源碼,但他並不能快速確定原因, 維護項目的人又不好找。通過webAPI service代碼他自己找到了可疑的原因是webAPI中的這個方法有可能阻擋了他期望的webAPI行為: Instance.EnableFallback() (公司隱私,改了名), 但他無法確定這個方法在實際運行的時候的具體返回值。

聽了朋友介紹,我能想到的一個方法是看一下他們公司的這個第三方的service進程的內部情況 (非生產環境,許可權是允許的)

分析

通過kubectl exec -it [namespace:pod] /bin/bash,我們成功進入了service的pod里。雖然是非生產環境,我們也儘量別打擾人家幹活  那麼…就選擇dump一下運行的dotnet進程嘍

由於這次的任務是觀察托管環境的某個記憶體位置的值,我選擇了用dotnet-dump

 

然後dotnet-dump analyze core_123 開始分析。

我們想要的是 Instance.EnableFallback 的返回值,而我的朋友已經知道這個Instance的type,所以用dumpheap -type找一下這個instance在哪裡:

 

 

 然後用!do一下instance具體內容:

1 > do 796f3840d080
2 Name:        XXX.Common.XXX.XXXInstance
3 MethodTable: 00007970d459d3a8
4 EEClass:     00007970d45a4fc0
5 Size:        80(0x50) bytes
6 File:        /app/XXX.dll
7 Fields:
8               MT    Field   Offset                 Type VT     Attr            Value Name
9 00007970d459d9e8  4000016       10 ...XXX]]  0 instance 0000796f3840d130 _evs

根據簡化和隱藏敏感信息後的代碼:

 

 知道了需要繼續用!do 看這個0000796f3840d130:

 1 > do 0000796f3840d130
 2 Name:        System.Collections.Generic.Dictionary`2[[System.String, System.Private.CoreLib],[XXX.Common.XXX.XXXEnv, XXX]]
 3 MethodTable: 00007970d459d718
 4 EEClass:     00007970ce610c00
 5 Size:        72(0x48) bytes
 6 File:        /usr/share/dotnet/shared/Microsoft.NETCore.App/3.1.32/System.Private.CoreLib.dll
 7 Fields:
 8               MT    Field   Offset                 Type VT     Attr            Value Name
 9 00007970ce636448  4001aec        8       System.Int32[]  0 instance 0000796f384143a8 _buckets
10 00007970ce636250  4001aed       10 ...ivate.CoreLib]][]  0 instance 0000796f384143d0 _entries
11 00007970ce5fa0e8  4001aee       30         System.Int32  1 instance                1 _count

大家如果瞭解.net Dictionary類型的實現,就知道目前這個dictionary是1size且具體的item值可以直接用!dp看:

 

 Dictionary里的_entries是個數組,item類型是value type,所以是inlined memory, 所以直接看0000796f38412948, 因為他是數組中第0個元素里的key-value pair里的value(XXXEnv instance的地址)。

1 > do 0000796f38412948
2 Name:        XXX.Common.XXXEnv
3 MethodTable: 00007970d459e700
4 EEClass:     00007970d45a5888
5 Size:        56(0x38) bytes
6 File:        /app/XXX.dll
7 Fields:
8               MT    Field   Offset                 Type VT     Attr            Value Name
9 00007970d340a988  400000a        8 ....Config.XXXConfig  0 instance 0000796f382898f0 _toggleConfig

最後看那個_toggleConfigInstance.EnableFallback()裡面一通調用最終會讀它的內容,簡化代碼如下:

 

 所以繼續!do看一下這個_toggleConfig:

 

 至此原因確定,懷疑的這個方法在當前這個webAPI service下會返回false.

後記

也許有朋友會問,直接dump type是XXXConfig的instance不就行了。是的,不過在這個dump文件中,我發現了不止一個active的XXXConfig instance, 也就是說不止一處會用到這個不唯一的XXXConfig, 而我需要明確Instance.EnableFallback最終的返回,所以需要耐心探索哈 

總結

我的朋友知道了他想確定的Instance.EnableFallback在第三方service運行的時候的真實值之後,也明確了他那邊的應對這個webAPI的調用方式了。

這次診斷的問題雖不是cpu過高、記憶體泄漏這類資源問題,但還是用上了與排查資源泄漏相同的底層調試診斷技術來解決。最後我的朋友很高興,吃了個定心丸


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 歡迎關註個人公眾號:愛喝可可牛奶 LeetCode演算法訓練-回溯總結 適用問題 組合問題:N個數裡面按一定規則找出k個數的集合 排列問題:N個數按一定規則全排列,有幾種排列方式 切割問題:一個字元串按一定規則有幾種切割方式 子集問題:一個N個數的集合里有多少符合條件的子集 棋盤問題:N皇後,解數獨等 ...
  • if條件語句 if語句 if條件語法結構: if 條件語句: 滿足條件運行的代碼1 滿足條件運行的代碼2 ... ps:條件語句(可以是單個數據,即本身就是布爾類型)需返回一個布爾類型,判斷是否進入條件分支語句 if True: print('條件成⽴執⾏的代碼1') print('條件成⽴執⾏的代 ...
  • Lambda表達式 Lambda表達式理解 Lambda表達式是Jdk 8 開始新增的一種語法形式;作用:用於簡化匿名內部類的代碼寫法 註意:Lambda表達式只能簡化函數式介面的匿名內部類!!! 什麼是函數式介面? 有且僅有一個抽象方法的介面。 註意:大部分函數式介面,上面可能會有一個@Funct ...
  • 本節開始,將對 ResourceManager 中一些常見行為進行分析探究,看某些具體關鍵的行為,在 RM 中是如何流轉的。本節將深入源碼探究「啟動 ApplicationMaster」的具體流程。 ...
  • 錯誤描述 在 Spring Cloud 項目中通過 Open Feign 遠程調用時出現如下錯誤: feign.codec.EncodeException: No qualifying bean of type 'org.springframework.boot.autoconfigure.http ...
  • 之前在做某個業務中,寫了個文件傳輸的程式,程式邏輯很簡單:掃描某個目錄下的文件,對文件進行一些處理,然後把文件移動到另一個目錄。 此前在大多數運行環境里,該程式一直正常運行,直到最近在一個新環境下,出現問題:文件移動失敗。查詢日誌發現在調用file.renameTo方法返回false。我第一反應是查 ...
  • C語言對記憶體的使用劃分為以下區域: 棧區(stack)、堆區(heap)、全局區(靜態區)、常量區、代碼區。 棧區: 由編譯器自動分配釋放,按記憶體地址從高(地址)到低(地址)存儲; 棧區內容的作用域為其所定義的函數內,生命周期為函數執行期間,函數結束自動釋放; 存放局部變數、const局部變數、函數 ...
  • 在上文中分析了 HttpURLConnection的用法,功能還是比較簡單的,沒有什麼封裝 接下來看看Apache HttpClient是如何封裝httpClient的 組成 HttpClient 5 的系統架構主要由以下幾個部分組成: HttpCore:核心包,包含了 HTTP 協議的核心抽象和實 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...