使用dotnet-monitor sidecar模式 dump docker運行的dotnet程式.

来源:https://www.cnblogs.com/calvinK/archive/2022/10/25/dotnet-monitor-sidecar-dump-memory.html
-Advertisement-
Play Games

前情概要 隨著容器和雲技術的發展, 大量的應用運行在雲上的容器中, 它們的好處是毋庸置疑的, 例如極大的提高了我們的研發部署速度, 快速的擴縮容等等, 但是也存在一些小小的問題, 例如難以調試. 基於VM的部署我們可以通過安全的方式登錄到主機上做一些你想做的事情, 但是雲上的容器那就是不太方便了(目 ...


前情概要

隨著容器和雲技術的發展, 大量的應用運行在雲上的容器中, 它們的好處是毋庸置疑的, 例如極大的提高了我們的研發部署速度, 快速的擴縮容等等, 但是也存在一些小小的問題, 例如難以調試.
基於VM的部署我們可以通過安全的方式登錄到主機上做一些你想做的事情, 但是雲上的容器那就是不太方便了(目前AWS的ECS已經有類似docker exec的方式直接進入容器中了, 其他的雲未作瞭解).
但是就算能進入容器也不意味著調試就好做了, 通常來說使用的鏡像都是經過優化和精簡的(如果要調式可能需要安裝大量的組件).

所以, 接下來介紹一下使用dotnet-monitor 來記憶體轉儲(memory dump)運行在容器中的 dotnet 程式.

需要提前知曉的一些知識點

什麼是 dotnet-monitor?

Announcing dotnet monitor in .NET 6 官方博客的原文:

Running a .NET application in diverse environments can make collecting diagnostics artifacts (e.g., logs, traces, process dumps) challenging. dotnet monitor is a tool that provides an unified way to collect these diagnostic artifacts regardless of whether running you’re running on your desktop machine or in a kubernetes cluster.

There are two different mechanisms for collection of these diagnostic artifacts:

An HTTP API for on demand collection of artifacts. You can call these API endpoints when you already know your application is experiencing an issue and you are interested in gathering more information.
Triggers for rule-based configuration for always-on collection of artifacts. You may configure rules to collect diagnostic artifacts when a desired condition is met, for example, collect a process dump when you have sustained high CPU.

google翻譯:

在不同的環境中運行 .NET 應用程式會使收集診斷工件(例如,日誌、跟蹤、進程轉儲)具有挑戰性。dotnet monitor是一個工具,它提供了一種統一的方式來收集這些診斷工件,無論您是在台式機上運行還是在 kubernetes 集群中運行。

收集這些診斷工件有兩種不同的機制:

用於按需收集工件的HTTP API 。當您已經知道您的應用程式遇到問題並且您有興趣收集更多信息時,您可以調用這些 API 端點。
基於規則的配置觸發器,用於始終線上收集工件。您可以配置規則以在滿足所需條件時收集診斷工件,例如,當您持續使用高 CPU 時收集進程轉儲。

dotnet-monitor工作在什麼位置?

借用官方博客中的一張圖說明一下dotnet-monitor工作在什麼地方

dotnet-monitor是如何能對我們的目標程式進行操作的?

dotnet-monitor 可以連接到dotnet運行時公開的一個診斷埠(diagnostic port)(3.0新提供的新功能), 並通過自定義協議(ipc protocol)與運行時交互,

更多調試知識和工具例如ETW, eventpipe, lldb, dotnet-trace, dotent-counters 等可以查看 dotnet diagnostics.

目標應用程式容器準備

首先, 我們得讓我們被調試的目標程式公開這個診斷埠, 因為預設情況下這個診斷埠只能由運行這個程式的用戶或者root用戶來訪問, 顯然sidecar 模式啟動的dotnet-monitor是不可能和目標程式用的是同一個用戶的.

未作特別聲明的話, 後文給出的實驗都是基於AWS FargateLinux 配置.

#添加環境變數
DOTNET_DiagnosticPorts=/my_diagnostic_volume/diag.sock,suspend,connect

/my_diagnostic_volume/diag.sockUnix Domain Socket 文件路徑, my_diagnostic_volume 是掛載的一個volume.
suspend 意思是讓運行時等待dotnet-monitor 連接進來之後在執行托管代碼.
connect 接受dotnet-monitor連接, 詳細解釋看這裡diagnostic ports
上述配置的完整語法結構是 address[,(listen|connect)][,(suspend|nosuspend)]
詳情請查看文檔configure additional diagnostic ports

如果我們的需要dump記憶體文件, 可能會遇到WriteDumpAsync failed - HRESULT: 0x00000000 issues 1783這樣的錯誤, 是因為許可權問題.
比如我在AWS Fargate中遇到的就是 /dump API 返回400錯誤 Write dump failed - HRESULT: 0x00000000, 目標程式輸出日誌 ptrace(ATTACH, 1) FAILED Operation not permitted.
解決這個需要吧SYS_PTRACE許可權給到目標程式. AWS Fargate 是編輯任務定義的json文件增加這一部分, docker 啟動是通過增加--cap-add=SYS_PTRACE 參數.

{
    "linuxParameters": {
        "capabilities": {
            "add": [
                "SYS_PTRACE"
            ]
        }
    }
}

最後, 配置目標程式容器依賴dotnet-monitor容器, 這樣可以先讓dotnet-monitor容器啟動後, 在啟動目標程式容器.
到此, 目標程式容器的配置就完成了, 接下來配置dotnet-monitor

dotnet-monitor容器準備

  • 增加 Docker image 作為目標容器的sidecar 容器.
  • 暴露埠52323 #dotnet-monitor映射埠.
  • 增加容器啟動命令參數 --no-auth # 簡單粗暴的讓所有的API都不要鑒權.
  • 添加環境變數
    • DOTNETMONITOR_DiagnosticPort__ConnectionMode=Listen # 必須的.
    • DOTNETMONITOR_DiagnosticPort__EndpointName=/my_diagnostic_volume/diag.sock # 目標容器配置的DOTNET_DiagnosticPorts中的address.
    • DOTNETMONITOR_Storage__DumpTempFolder=/my_diagnostic_volume/dump_files # dump記憶體是用的目錄.
    • DOTNETMONITOR_Urls=http://+:52323 # dotnet-monitor要提供服務在什麼埠上. dotnet-monitor預設用的就是52323.

詳細的文檔解釋看這裡

至此, 所有的配置就都完成了.

使用dotnet-monitor 來dump目標容器的記憶體文件

Get 請求 /dump endpoint 即可下載記憶體轉儲文件.

wget ip:52323/dump -O my_target_application_memory_dump.dmp

當前可以用API's列表, 詳情請看這裡API's

| Route            | Description                                                        | Version Introduced |
| ---------------- | ------------------------------------------------------------------ | ------------------ |
| /processes       | Gets detailed information about discoverable processes.            | 6.0                |
| /dump            | Captures managed dumps of processes without using a debugger.      | 6.0                |
| /gcdump          | Captures GC dumps of processes.                                    | 6.0                |
| /trace           | Captures traces of processes without using a profiler.             | 6.0                |
| /metrics         | Captures metrics of a process in the Prometheus exposition format. | 6.0                |
| /livemetrics     | Captures live metrics of a process.                                | 6.0                |
| /stacks          | [Experimental] Gets the current callstacks of all .NET threads.    | 7.0                |
| /logs            | Captures logs of processes.                                        | 6.0                |
| /info            | Gets info about dotnet monitor.                                    | 6.0                |
| /operations      | Gets egress operation status or cancels operations.                | 6.0                |
| /collectionrules | Gets the current state of collection rules.                        | 6.3                |

在之後的對記憶體文件的分析可以使用dotnet-dump, lldb等程式.
更多高級用法請查看, 例如可以配置記憶體每增加100Mb就觸發dump記憶體文件.

相關鏈接

https://learn.microsoft.com/zh-cn/dotnet/core/diagnostics/dotnet-monitor
https://learn.microsoft.com/zh-cn/dotnet/core/diagnostics/dotnet-dump
https://learn.microsoft.com/zh-cn/dotnet/core/diagnostics/diagnostic-port
https://github.com/dotnet/dotnet-monitor/blob/main/README.md
https://devblogs.microsoft.com/dotnet/announcing-dotnet-monitor-in-net-6/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [優美的Java代碼之try...catch] 概述 通常我們使用try...catch()捕獲異常時,如果遇到類似IO流的處理,要在finally部分關閉IO流。這是JDK1.7之前的寫法了; 在JDK7以後,可以使用優化後的try-with-resource語句,該語句確保了每個資源,在語句結束 ...
  • 摘要:當你使用java實現一個線程同步的對象時,一定會包含一個問題:你該如何保證多個線程訪問該對象時,正確地進行阻塞等待,正確地被喚醒? 本文分享自華為雲社區《JUC中的AQS底層詳細超詳解,剖析AQS設計中所需要考慮的各種問題!》,作者: breakDawn 。 java中AQS究竟是做什麼的? ...
  • Dubbo 和Zookeeper 不是SpringCloud的東西,放在這裡只是為了方便複習; 1、下載安裝Zookeeper和Dubbo 1.1 下載安裝教程 下載安裝教程 windows環境下安裝zookeeper教程詳解(單機版) 1.2 啟動頁面 1.2.1 zkServer.xmd zoo ...
  • Reference Core Java Volume Ⅱ 10th Edition 1 對稱加密 “Java密碼擴展”包含了一個Cipher,它是所有密碼演算法的超類。通過getInstance(algorithmName)可以獲得一個密碼對象。 cipher.init(mode, key);模式有以 ...
  • 引入流 流是什麼 流是Java API的新成員,它允許你以聲明性的方式處理數據集合。可以看成遍曆數據集的高級迭代。流可以透明地並行處理,無需編寫多線程代碼。我們先簡單看一下使用流的好處。下麵兩段代碼都是用來返回年齡小於14歲的初中生的姓名,並按照年齡排序。 假如我們有下麵Student實體類 @Da ...
  • 樹結構 1.1 樹的定義 樹(Tree):個節點構成的有限集合。當n = 0時,稱為空樹。對於任一棵非空樹(n>0),它具備以下性質: 樹中有一個稱為"根(Root)"的特殊節點,用r表示;其餘節點可分為m(m>0)個互不相交的有限集、,...,,其中每個集合本身又是一棵樹,稱為原來樹的子樹(Sub ...
  • 本次案例代碼實現思路: 本次案例代碼實現思路: 打開考試網站 selenium --> 瀏覽器驅動 --> 操作瀏覽器 <模擬人的行為做操作瀏覽器> 獲取答案 獲取答案網站鏈接 獲取問題以及答案內容 對比題目以及答案 選出正確答案 獲取問題答案選項 和正確的答案進行對比 如果正確答案和選擇答案一致, ...
  • 前言 好記性不如爛筆頭,之前做項目的時候很熟練很順手就沒有寫筆記。因為排期問題項目中斷幾個月之後需要重新拾起來,結果發現自己現在忘記得差不多了,於是還是決定寫點東西記錄一下。即便是簡單的項目設置,忘記的時候也還是很痛苦啊。QAQ 1 版本信息 Unity 版本:2022.1.18f1c1 Visua ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...