【譯】Asp.net core應用在 Kubernetes上記憶體使用率過高問題分析

来源:http://www.cnblogs.com/eastpig/archive/2017/11/12/7822892.html
-Advertisement-
Play Games

原文:https://blog.markvincze.com/troubleshooting-high-memory-usage-with-asp-net-core-on-kubernetes/ ps:我不是死板翻譯原文的,儘量的通俗一點,如有不對歡迎指出,謝謝哈。 在生產環境中,我們把asp.ne ...


原文:https://blog.markvincze.com/troubleshooting-high-memory-usage-with-asp-net-core-on-kubernetes/

ps:我不是死板翻譯原文的,儘量的通俗一點,如有不對歡迎指出,謝謝哈。

在生產環境中,我們把asp.net core api應用通過Kubernetes 部署在了Google Cloud (GCE—Google Container Engine)。我們發現大多數的組件(core應用)的記憶體使用率都不合理。我們把應用的記憶體限制設置成了500MB, 並且還發現了很多api應用實例因為超過了記憶體限制而被Kubernetes 不斷的重啟(應該docker設置了--restart)。

下麵2張圖是我們其中的2個api,當Kubernetes重啟他們時,你會發現他們先是一直增長,然後到達了記憶體限制的點。

 針對於這個現象我們花了很多時間來調查這個issue,期間嘗試過通過抓dumps來分析,但是並沒有發現問題所在。

我們也嘗試使用多種方式,在我們的開發環境來複現這個問題:

  • in dev configuration in VS
  • on Windows with a production build
  • on Ubuntu with a production build
  • in Docker, using the actual production image

但是上述環境下,他們都沒有超過500mb的記憶體使用情況,都是增長到100-150mb左右就停止了。

期間,為了減輕容器因為超過限制的最大記憶體而頻繁重啟我們將記憶體限制從500mb增加到1000mb,在此之後,有趣的是記憶體的使用情況變得如下圖所示:

測試下來發現記憶體的使用並不是無限制的增大的,但是也是封頂600mb左右,並且這個數字在不同的容器實例以及實例重啟之後近乎保持一致。

這個現象清楚的表明我們的容器中的應用並沒有記憶體泄漏,只是有一塊記憶體被分配了而沒有得到釋放。所以我開始把關註點轉移到“運行在Kubernetes的.net程式是如何限制記憶體的“。

事實上Kubernetes最終也是將程式運行在docker容器中的,並且docker容器可以通過docker run --memory參數來限制記憶體的使用。所以我懷疑也許是Kubernetes並沒有傳遞任何有關記憶體限制的參數到docker容器實例中,所以.net程式理所當然的認為當前機器有好多好多的可用記憶體可以使用。

但是並不是這種情況,我們發現相反的內容(因為作者懷疑是Kubernetes沒有傳遞和記憶體相關的參數)在the documentation.

The spec.containers[].resources.limits.memory is converted to an integer, and used as the value of the --memory flag in the docker run command.

(這句話的意思是Kubernetes的spec.containers[].resources.limits.memory會自動沿用docker run中的--memory參數所設置的整數值

這似乎又到了另一個死衚衕了。我也嘗試在自己電腦里的docker中運行api程式,並且通過--memory參數傳遞多種記憶體限定值,但是1.我不能復現上述600mb記憶體使用的場景,記憶體只保持在150mb左右,2.也沒有觀察到容器實例運行的超過它的記憶體限制,即使我通過--memory參數來指定一個小於150mb的值,這個容器實例依然能夠在這個更小的記憶體限定值下運行的完好。

 

很早的時候我也在github上提過一個關於記憶體泄漏的issue關聯到Kestrel(core的一個基於libuv的新的伺服器),並且在這一點上,Tim Seaward發了一個有趣的suggestion關於檢查我的應用在不同環境下所列印出的cpu的個數,因為cpu的是影響記憶體使用的一個巨大因素。

我嘗試在代碼里通過Environment.ProcessorCount在不同的環境下列印出的數量如下:

  • On my machine, just doing dotnet run, the value was 4.
  • On my machine, with Docker, it was 1.
  • On Google Cloud Kubernetes it was 8.

這就能最終給我一個解釋了,因為cpu的數量真的會影響記憶體的使用數量。cpu核數越多,記憶體使用量也就越多(對於作者來說,他還不是確切的瞭解gc的類型,cpu的核數,與.net程式所使用記憶體的大小之間的關係,雖然this post這個鏈接包含了有關GC的資料)。

最終的建議呢,就是把GC模式從Server GC(伺服器模式)切換到Workstation GC(模式),這樣就能達到低記憶體使用率的優化效果。只需要在csproj項目文件中做如下動作:

<PropertyGroup> 
    <ServerGarbageCollection>false</ServerGarbageCollection>
</PropertyGroup>

做了這個改動後,重新發佈我的api,結果就如鄉下所示(藍色的線):

workstation gc模式使得應用對於記憶體的使用變得更加”保守“,並且記憶體的使用從大約600mb降低到了100到150mb之間。假設工作站模式是通過犧牲一些性能和吞吐量來實現這個”600mb到150mb的效果“話(據官當伺服器模式在某些場景下是相對優於工作站模式的),但是迄今為止我並沒有發現任何api速度和吞吐量的衰減,雖然我的這個api並不是一個對性能有著及其苛刻的要求。

 

通過這個故事總結到:OS,可用記憶體,cpu核數都是定位記憶體問題的關鍵因素,因為他們會大量影響想著.net的GC。如果你被問題卡住了,請不要猶豫的把問題拋出來,並且在很多.net 社區裡面有很多極好的人會很樂於助人。

 =============================================分割線========================================

小弟我們公司下的項目也是這個問題,當時困擾了好久,為什麼呢,因為之前在windows下麵,記憶體占用不會”太明顯“,因為GC起到了決定性的作用,但是在core的環境下,在加之docker+linux,遇到這樣的時當時一度懷疑是docker的問題,當時也沒有像這位國外友人這樣去分析這個問題。通過這個問題我學到瞭如下:

1.學到了這位老哥定位思考問題的步驟,從是否是k8s的問題-》多環境問題-》github issue-》自己動手去類比推測-》最終解決問題。

2.GC的知識點補充:this post

3.除此之外還有很多知識點都隱藏到了:suggestion(希望大家仔細再看看)

4.我沒記錯的之前英文的官檔里,講項目配置文件的一節中提到了GC的配置

一開始(對GC的2種類型還不瞭解的情況),正常人看到這個true指的是激活該應用程式的GC垃圾回收,而並沒有註意到老外所調查的結果(true其實是指的激活伺服器GC模式,false不是指不GC,而是指的使用工作站GC模式),我能說微軟是否能夠稍微“貼心點”指出true和false的真正區別(其實是我們自己.net研究的還不夠透徹,哈哈哈),這樣就不會有像我,像這個老外一樣,對於跑在docker容器里的core應用記憶體占用率過高而表示“質疑”。

ps:我們生產已改成false,當然true也沒問題,只不過伺服器記憶體被“只吃不拉”而已。

 

最後希望大家多多支持core,為張大大打個廣告:微信公眾號搜索”opendotnet“進行關註,知識共分享。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ABP是“ASP.NET Boilerplate Project (ASP.NET樣板項目)”的簡稱。ASP.NET Boilerplate是一個用最佳實踐和流行技術開發現代WEB應用程式的新起點,它旨在成為一個通用的WEB應用程式框架和項目模板。框架ABP是基於最新的ASP.NET CORE,AS ...
  • 一、系統介紹 本軟體主要讓你的文件夾多彩多樣化,而不是千篇一律黃色的文件夾,相信豐富多彩的顏色更便於記憶、能讓心情愉快些。 文件夾顏色眾多,到底有多少種呢,10種? 100種? 1000種? NO,精確計算是255*255*255 , 只是很多顏色很相近, 而能夠明顯有差別的不是很多,為了便於自己記 ...
  • 在ABP框架下使用NHibernate和Dapper實現資料庫訪問。 ...
  • 如果我們要從線程池中取消某個線程的操作,應該如何實現呢?本示例使用CancellationTokenSource和CancellationToken兩個類來實現在取消線程池中的操作。 ...
  • 在進行實體轉換操作的時候如果需要在對兩個實體之間兩個屬性欄位差不多相同的類要進行一個互相的轉換,我們要把a對象的所有欄位的值都複製給b對象,我們只能用b.屬性=a.屬性來寫,如果屬性欄位太多的話,就要寫很多行複製語句,麻煩還容易漏掉一些,這個時候可以利用c#的反射來實現複製。我們可以寫這樣一個利用泛 ...
  • 用Windows 8.1的童鞋應該知道OneNote裡面有一個RadialMenu。如下圖,下圖是WIn10應用Drawboard PDF的RadialMenu,Win8.1的機器不好找了。哈哈,由於整個文章比較長,大家可以放《給我一首歌的時間》 邊聽邊看。<滑稽> 從設計到開發包括修複一些bug, ...
  • 背水一戰 Windows 10 之 控制項(控制項基類 - UIElement ): 獲取 UIElement 的位置, UIElement 的佈局相關(Measure, Arrange), UIElement 的非完整像素佈局(UseLayoutRounding), UIElement 的其他特性(V... ...
  • 一、前言 最近使用 的時候,一段時間久會產生 這個問題。後來通過測試,發現部署在 上的站點,預設情況下,IIS會在每個間隔固定時間回收 ,如果剛剛好有很多請求訪問調用了 映射的介面,就會產生如下問題。 System.NullReferenceException: 未將對象引用設置到對象的實例。 在 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...