.Net平臺GC VS JVM垃圾回收

来源:https://www.cnblogs.com/sword-successful/archive/2020/04/30/12808770.html
-Advertisement-
Play Games

前言 不知道你平時是否關註程式記憶體使用情況,我是關註的比較少,正好藉著優化本地一個程式的空對比了一下.Net平臺垃圾回收和jvm垃圾回收,順便用dotMemory看了程式運行後的記憶體快照,生成記憶體快照後,媽媽再也不擔心我優化程式找不到方向了。 .Net平臺垃圾回收 記憶體優化 憑空想象這些概念多少會索 ...


前言

不知道你平時是否關註程式記憶體使用情況,我是關註的比較少,正好藉著優化本地一個程式的空對比了一下.Net平臺垃圾回收和jvm垃圾回收,順便用dotMemory看了程式運行後的記憶體快照,生成記憶體快照後,媽媽再也不擔心我優化程式找不到方向了。

.Net平臺垃圾回收

記憶體優化

憑空想象這些概念多少會索然無味,下圖是我我基於本地的一個程式生成的記憶體快照,使用jetbrains推出的dotMemory工具生成。

生成記憶體快照

QQ截圖20200422180141.png
程式運行時可以通過右上角的Get SnapShot按鈕生成記憶體快照,記憶體快照里可以看到具體的對象、消耗記憶體的情況,比如說一些大的字元串對象,重覆的大量的字元串對象, 那麼從上面這張圖上都能看到哪些關鍵字呢?
什麼是Heap generation1和Heap greneration2呢?
什麼是Allocated呢?

什麼是GC

GC (Garbage Collection)如其名,就是垃圾收集,當然這裡僅就記憶體而言。Garbage Collector(垃圾收集器,在不至於混淆的情況下也成為GC)以應用程式的root為基礎,遍歷應用程式在托管堆(Managed Heap)上動態分配的所有對象,通過識別它們是否被引用來確定哪些對象是已經死亡的、哪些仍需要被使用。已經不再被應用程式的root或者別的對象所引用的對象就是已經死亡對象,即所謂的垃圾,需要被回收。這就是GC工作的原理。為了實現這個原理,GC有多種演算法。比較常見的演算法有Reference Counting,Mark Sweep,Copy Collection等等。目前主流的虛擬系統.NET CLR,JVM都是採用的Mark Sweep演算法。

Mark-Compact 標記壓縮演算法

簡單地把.NET的GC演算法看作Mark-Compact演算法。階段1: Mark-Sweep 標記清除階段,先假設heap中所有對象都可以回收,然後找出不能回收的對象,給這些對象打上標記,最後heap中沒有打標記的對象都是可以被回收的;階段2: Compact 壓縮階段,對象回收之後heap記憶體空間變得不連續,在heap中移動這些對象,使他們重新從heap基地址開始連續排列,類似於磁碟空間的碎片整理。
     


        Heap記憶體經過回收、壓縮之後,可以繼續採用前面的heap記憶體分配方法,即僅用一個指針記錄heap分配的起始地址就可以。主要處理步驟:將線程掛起→確定roots→創建reachable objects graph→對象回收→heap壓縮→指針修複。可以這樣理解roots:heap中對象的引用關係錯綜複雜(交叉引用、迴圈引用),形成複雜的graph,roots是CLR在heap之外可以找到的各種入口點。
        GC搜索roots的地方包括全局對象、靜態變數、局部對象、函數調用參數、當前CPU寄存器中的對象指針(還有finalization queue)等。主要可以歸為2種類型:已經初始化了的靜態變數、線程仍在使用的對象(stack+CPU register) 。 Reachable objects:指根據對象引用關係,從roots出發可以到達的對象。例如當前執行函數的局部變數對象A是一個root object,他的成員變數引用了對象B,則B是一個reachable object。從roots出發可以創建reachable objects graph,剩餘對象即為unreachable,可以被回收。
    
           指針修複是因為compact過程移動了heap對象,對象地址發生變化,需要修複所有引用指針,包括stack、CPU register中的指針以及heap中其他對象的引用指針。Debug和release執行模式之間稍有區別,release模式下後續代碼沒有引用的對象是unreachable的,而debug模式下需要等到當前函數執行完畢,這些對象才會成為unreachable,目的是為了調試時跟蹤局部對象的內容。傳給了COM+的托管對象也會成為root,並且具有一個引用計數器以相容COM+的記憶體管理機制,引用計數器為0時,這些對象才可能成為被回收對象。Pinned objects指分配之後不能移動位置的對象,例如傳遞給非托管代碼的對象(或者使用了fixed關鍵字),GC在指針修複時無法修改非托管代碼中的引用指針,因此將這些對象移動將發生異常。pinned objects會導致heap出現碎片,但大部分情況來說傳給非托管代碼的對象應當在GC時能夠被回收掉。


垃圾回收之三個階段

PhaseInGarbageCollection.png

  • Marking Phase:在標記階段會創建所有活動對象的列表。 這是通過遵循所有根對象的引用來完成的。 不在活動對象列表中的所有對象都可能從堆記憶體中刪除。
  • Relocating Phase:所有活動對象列表中所有對象的引用在重定位階段進行更新,以便它們指向在壓縮階段將對象重定位到的新位置。
  • Compacting Phase:隨著釋放死亡對象占用的空間並移動剩餘的活動對象,堆會在壓縮階段被壓縮。 垃圾回收後剩餘的所有活動對象均按其原始順序移至堆記憶體的較舊端。

垃圾回收之Genearation - 分代

堆記憶體在回收過程中不是一次性回收所有,而是分為3代,目前也支持3代,根據上面的截圖可以看出來。因此可以在垃圾回收期間適當地處理具有不同生存期的各種對象。 取決於項目的大小,每一代的記憶體將由公共語言運行時(CLR)給出。 在內部,Optimization Engine將調用Collection Means方法來選擇哪些對象將進入第1代或第2代。


HeapGenerationInGarbageCollection.png

  • Generation 0:所有短期對象(例如臨時變數)都包含在堆記憶體的第0代中。 除非它們是大對象,否則所有新分配的對象也是隱式的第0代對象。 通常,垃圾回收的頻率在第0代中最高。
  • Generation 1:如果運行在垃圾回收中未釋放的第0代對象占用的空間,則這些對象將移至第1代。這一代中的對象是第0代中的短期對象和第2代中的長期對象之間的一種緩衝區對象。
  • Generation 2:如果某個第1代對象占用的空間未在下一次垃圾回收運行中釋放,則這些對象將移至第2代。第2代對象的生存期很長,例如靜態對象,因為它們整個都保留在堆記憶體中 處理持續時間。

GC給我們帶來的優勢

  • 垃圾回收使用3個代的概念成功的在托管堆上有效的分配對象記憶體。
  • 不再需要手動釋放記憶體,GC會在不需要時自動釋放記憶體空間。
  • 垃圾回收可以安全地處理記憶體分配,因此沒有對象會錯誤地使用另一個對象的內容。
  • 新創建的對象的構造函數不必初始化所有數據欄位,因為垃圾回收會清除以前釋放的對象的記憶體。

非托管堆

說了半天都在說托管堆,那麼非托管堆呢?垃圾回收是不知道什麼時候去處理非托管堆資源,比如文件句柄,網路連接、資料庫連接。以下兩種方式用來處理非托管堆垃圾回收。

  1. 在定義類時聲明析構函數。
  2. 在定義類時實現IDisposable介面並實現Dispose函數, 實現介面有在程式中有兩種處理方法,使用using關鍵字,推薦使用, 再就是在finally中顯式調用Dispose函數。

附錄GC常用函數

返回指定對象的當前代數
public static int GetGeneration(Object);

檢索當前認為要分配的位元組數。 一個參數,指示此方法是否可以等待較短間隔再返回,以便系統回收垃圾和終結對象
public static long GetTotalMemory (bool forceFullCollection);

返回已經對對象的指定代進行的垃圾回收次數。
public static int CollectionCount (int generation);

獲取垃圾回收的記憶體信息
public static GCMemoryInfo GetGCMemoryInfo ();

強制對所有代進行即時垃圾回收。
public static void Collect ();

jvm垃圾回收

好吧,說到這裡還沒提出來jvm垃圾回收,如果你已經瞭解了jvm垃圾回收,從上面的垃圾回收演算法和分代回收來看,.Net平臺和jvm在垃圾回收這塊設計思路是一致的,兩者的垃圾回收演算法都包含:標記清除演算法、複製演算法、標記整理演算法、分代收集演算法。 
       ** 當前商業虛擬機演算法都使用分代收集演算法,jvm根據對象的存活周期把記憶體劃分為:
年輕代、老年代、永久代。

新生代(Young generation)

絕大多數最新被創建的對象會被分配到這裡,由於大部分對象在創建後會很快變得不可達,所以很多對象被創建在新生代,然後消失。對象從這個區域消失的過程我們稱之為 minor GC。
新生代 中存在一個Eden區和兩個Survivor區.新對象會首先分配在Eden中(如果新對象過大,會直接分配在老年代中)。在GC中,Eden中的對象會被移動到Survivor中,直至對象滿足一定的年紀(定義為熬過GC的次數),會被移動到老年代。
可以設置新生代和老年代的相對大小。這種方式的優點是新生代大小會隨著整個堆大小動態擴展。參數 -XX:NewRatio 設置老年代與新生代的比例。例如 -XX:NewRatio=8 指定 老年代/新生代 為8/1. 老年代 占堆大小的 7/8 ,新生代 占堆大小的 1/8(預設即是 1/8)。
例如:

-XX:NewSize=64m -XX:MaxNewSize=1024m -XX:NewRatio=8

老年代(Old generation)

對象沒有變得不可達,並且從新生代中存活下來,會被拷貝到這裡。其所占用的空間要比新生代多。也正由於其相對較大的空間,發生在老年代上的GC要比新生代要少得多。對象從老年代中消失的過程,可以稱之為major GC(或者full GC)。

永久代(permanent generation)

像一些類的層級信息,方法數據 和方法信息(如位元組碼,棧 和 變數大小),運行時常量池(JDK7之後移出永久代),已確定的符號引用和虛方法表等等。它們幾乎都是靜態的並且很少被卸載和回收,在JDK8之前的HotSpot虛擬機中,類的這些"永久的" 數據存放在一個叫做永久代的區域。
永久代一段連續的記憶體空間,我們在JVM啟動之前可以通過設置-XX:MaxPermSize的值來控制永久代的大小。但是JDK8之後取消了永久代,這些元數據被移到了一個與堆不相連的稱為元空間 (Metaspace) 的本地記憶體區域。

小結

JDK8堆記憶體一般是劃分為年輕代老年代不同年代 根據自身特性採用不同的垃圾收集演算法
對於新生代,每次GC時都有大量的對象死亡,只有少量對象存活。考慮到複製成本低,適合採用複製演算法。因此有了From SurvivorTo Survivor區域。
對於老年代,因為對象存活率****高,沒有額外的記憶體空間對它進行擔保。因而適合採用標記-清理演算法標記-整理演算法進行回收。

總結

目前對比了.Net平臺垃圾回收和jvm垃圾回收,對於垃圾回收演算法和分代的概念,兩者設計思路都相同,唯一的區別我個人覺的JDK8以後jvm的垃圾回收效率更高,根據不同的代使用不同的垃圾收集演算法,這一點似乎是.Net平臺垃圾回收沒有實現的地方。

參考鏈接

https://www.geeksforgeeks.org/garbage-collection-in-c-sharp-dot-net-framework/
https://juejin.im/post/5b4dea755188251ac1098e98
https://kb.cnblogs.com/page/106720/
https://www.zhihu.com/question/31806845







您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Gevent 是一個第三方庫,可以輕鬆通過gevent實現併發同步或非同步編程 ...
  • 程式目的:輸入年份和月份,查詢當月的日曆。弄著玩。程式界面:代碼如下:# coding:utf8from tkinter import *from calendar import *from time import *class APP: def __init__(self, master): fr... ...
  • 環境: 介紹 Quickuse.Caching 快速應用緩存組件,提供常用緩存使用方式,目前支持常用的 、`Redis Memcache` 運行時緩存 有時候也本稱作為伺服器緩存、進程緩存、站點緩存、程式緩存、本地緩存......各式各樣,我理解的其實他們都一個東西,都是在程式運行的時候才可以使用的 ...
  • 在之前的文章abp(net core)+easyui+efcore實現倉儲管理系統——入庫管理之九(四十五) 中我們已經實現了修改與刪除入庫單,今天來測試一下入庫單的修改與刪除功能。 ...
  • 如果你經常看開源項目的源碼,你會發現很多Dispose方法中都有這麼一句代碼: ,看過一兩次可能無所謂,看多了就來了興趣,這篇就跟大家聊一聊。 一:背景 1. 在哪發現的 相信現在Mysql在.Net領域中鋪的面越來越廣了,C 對接MySql的MySql.Data類庫的代碼大家可以研究研究,幾乎所有 ...
  • 前言 今天 .NET 官方博客宣佈 C 9 Source Generators 第一個預覽版發佈,這是一個用戶已經喊了快 5 年特性,今天終於發佈了。 簡介 Source Generators 顧名思義代碼生成器,它允許開發者在代碼編譯過程中獲取查看用戶代碼並且生成新的 C 代碼參與編譯過程,並且可 ...
  • 1、前言 面向對象設計(OOD)里有一個重要的思想就是依賴倒置原則(DIP),並由該原則牽引出依賴註入(DI)、控制反轉(IOC)及其容器等概念。在學習Core依賴註入、服務生命周期之前,下麵讓我們先瞭解下依賴倒置原則(DIP)、依賴註入(DI)、控制反轉(IOC)等概念,然後再深入學習Core依賴 ...
  • 參考文檔 https://www.cnblogs.com/htsboke/p/10956807.html https://www.cnblogs.com/lenmom/p/8510572.html 在WebApi項目中使用AutoFac,結構如下: 首先在Api項目當中引用AutoFac包,如下圖所 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...