從原理聊JVM(三):詳解現代垃圾回收器Shenandoah和ZGC

来源:https://www.cnblogs.com/Jcloud/archive/2023/04/27/17358079.html
-Advertisement-
Play Games

現代的垃圾回收器為了低停頓的目標可謂將“併發”二字玩到極致,Shenandoah在G1基礎上做了非常多的優化來使回收階段並行,而ZGC直接採用了染色指針、NUMA等黑科技,目的都是為了讓Java開發者可以更多的將精力放在如何使用對象讓程式更好的運行,剩下的一切交給GC,我們所做的只需享受現代化GC技... ...


作者:京東科技 康志興

Shenandoah

Shenandoah一詞來自於印第安語,十九世紀四十年代有一首著名的航海歌曲在水手中廣為流傳,講述一位年輕富商愛上印第安酋長Shenandoah的女兒的故事。 後來美國有一條位於Virginia州西部的小河以此命名,所以Shenandoah的中文譯名為“情人渡”。

Shenandoah首次出現在Open JDK12中,是由Red Hat開發,主要為瞭解決之前各種垃圾回收器處理大堆時停頓較長的問題。

相比較G1將低停頓做到了百毫秒級別,Shenandoah的設計目標是將停頓壓縮到10ms級別,且與堆大小無關。它的設計非常激進,很多設計點在權衡上更傾向於低停頓,而不是高吞吐。

“G1的繼承者”

Shenandoah是OpenJDK中的垃圾處理器,但相比較Oracle JDK中根正苗紅的ZGC,Shenandoah可以說更像是G1的繼承者,很多方面與G1非常相似,甚至共用了一部分代碼。

總的來說,Shenandoah和G1有三點主要區別:

1.G1的回收是需要STW的,而且這部分停頓占整體停頓時間的80%以上,Shenandoah則實現了併發回收。

2.Shenandoah不再區分年輕代和年老代。

3.Shenandoah使用連接矩陣替代G1中的卡表。

關於G1的詳細介紹請翻看前一篇:從原理聊JVM(二):從串列收集器到分區收集開創者G1

連接矩陣(Connection Matrix)

G1中每個Region都要維護卡表,既耗費計算資源還占據了非常大的記憶體空間,Shenandoah使用了連接矩陣來優化了這個問題。

連接矩陣可以簡單理解為一個二維表格,如果Region A中有對象指向Region B中的對象,那麼就在表格的第A行第B列打上標記。

比如,Region 1指向Region 3,Region 4指向Region 2,Region 3指向Region 5:

connection-matrix

相比G1的記憶集來說,連接矩陣的顆粒度更粗,直接指向了整個Region,所以掃描範圍更大。但由於此時GC是併發進行的,所以這是通過選擇更低資源消耗的連接矩陣而對吞吐進行妥協的一項決策。

轉髮指針

轉髮指針的性能優勢

想要達到併發回收,就需要在用戶線程運行的同時,將存活對象逐步複製到空的Region中,這個過程中就會在堆中同時存在新舊兩個對象。那麼如何讓用戶線程訪問到新對象呢?

此前,通常是在舊對象原有記憶體上設置保護陷阱(Memory Protection Trap),當訪問到這個舊對象時就會發生自陷異常,使程式進入到預設的異常處理器中,再由處理器中的代碼將訪問轉發到複製後的新對象上。

自陷是由線程發起來打斷當前執行的程式,進而獲得CPU的使用權。這一操作通常需要操作系統參與,那麼就會發生用戶態到內核態的轉換,代價十分巨大。

所以Rodney A.Brooks提出了使用轉髮指針來實現通過舊對象訪問新對象的方式:在對象頭前面增加一個新的引用欄位,在非併發移動情況下指向自己,產生新對象後指向新對象。那麼當訪問對象的時候,都需要先訪問轉髮指針看看其指向哪裡。雖然和記憶體自陷方案相比同樣需要多一次訪問轉發的開銷,但是前者消耗小了很多。

brooks-pointers

轉髮指針的問題

轉髮指針主要存在兩個問題:修改時的線程安全問題和高頻訪問的性能問題

1.對象體增加了一個轉髮指針,這個指針的修改和對象本身的修改就存在了線程安全問題。如果通過被訪問就可能發生複製了新對象後,轉發對象修改之前發生了舊對象的修改,這就存在兩個對象不一致的問題了。對於這個問題,Shenandoah是通過CAS操作來保證修改正確性的。

2.轉髮指針的加入需要覆蓋所有對象訪問的場景,包括讀、寫、加鎖等等,所以需要同時設置讀屏障和寫屏障。尤其讀操作相比單純寫操作出現頻率更高,這樣高頻操作帶來的性能問題影響巨大。所以Shenandoah在JDK13中對此進行了優化,將記憶體屏障模型改為引用訪問屏障,也就是說,僅僅在對象中引用類型的讀寫操作增加屏障,而不去管原生對象的操作,這就省去了大量的對象訪問操作。

Shenandoah的運行步驟

shenandoah-steps

  1. 初始標記(Init Mark)[STW] [同G1]

標記與GC Roots直接關聯的對象。

  1. 併發標記(Concurrent Marking)[同G1]

遍歷對象圖,標記全部可達對象。

  1. 最終標記(Final Mark)[STW] [同G1]

處理剩餘的SATB掃描,併在這個階段統計出回收價值最高的Region,將這些Region構成一組回收集。

  1. 併發清理(Concurrent Cleanup)

回收所有不包含任何存活對象的Region(這類Region被稱為Immediate Garbage Region)。

  1. 併發回收(Concurrent Evacuation)

將回收集裡面的存貨對象複製到一個其他未被使用的Region中。併發複製存活對象,就會在同一時間內,同一對象在堆中存在兩份,那麼就存在該對象的讀寫一致性問題。Shenandoah通過使用轉髮指針將舊對象的請求指向新對象解決了這個問題。這也是Shenandoah和其他GC最大的不同。

  1. 初始引用更新(Init Update References)[STW]

併發回收後,需要將所有指向舊對象的引用修正到新對象上。這個階段實際上並沒有實際操作,只是設置一個阻塞點來保證上述併發操作均已完成。

  1. 併發引用更新(Concurrent Update References)

順著記憶體物理地址線性遍歷堆空間,更新併發回收階段複製的對象的引用。

  1. 最終引用更新(Final Update References)[STW]

堆空間中的引用更新完畢後,最後需要修正GC Roots中的引用。

  1. 併發清理(Concurrent Cleanup)

此時回收集中Region應該全部變成Immediate Garbage Region了,再次執行併發清理,將這些Region全部回收。

ZGC

ZGC是Oracle官方研發並JDK11中引入,並於JDK15中作為生產就緒使用,其設計之初定義了三大目標:

1.支持TB級記憶體

2.停頓控制在10ms以內,且不隨堆大小增加而增加

3.對程式吞吐量影響小於15%

隨著JDK的迭代,目前JDK16及以上版本,ZGC已經可以實現不超過1毫秒的停頓,適用於堆大小在8MB到16TB之間。

ZGC的記憶體佈局

ZGC和G1一樣也採用了分區域的堆記憶體佈局,不同的是,ZGC的Region(官方稱為Page,概念同G1的Region)可以動態創建和銷毀,容量也可以動態調整。

ZGC的Region分為三種:

1.小型Region容量固定為2MB,用於存放小於256KB的對象。

2.中型Region容量固定為32MB,用於存放大於等於256KB但不足4MB的對象。

3.大型Region容量為2MB的整數倍,存放4MB及以上大小的對象,而且每個大型Region中只存放一個大對象。由於大對象移動代價過大,所以該對象不會被重分配。

zgc-regions

重分配集(Relocation Set)

G1中的回收集用來存放所有需要G1掃描的Region,而ZGC為了省去卡表的維護,標記過程會掃描所有Region,如果判定某個Region中的存活對象需要被重分配,那麼就將該Region放入重分配集中。

通俗的說,如果將GC分為標記和回收兩個主要階段,那麼回收集是用來判定標記哪些Region,重分配集用來判定回收哪些Region

染色指針

和Shenandoah相同,ZGC也實現了併發回收,不同的是前者是使用轉髮指針來實現的,後者則是採用染色指針的技術來實現。

三色標記本質上與對象無關,僅僅與引用有關:通過引用關係判定對像存活與否。HotSpot虛擬機中不同垃圾回收器有著不同的處理方式,有些是標記在對象頭中,有些是標記在單獨的數據結構中,而ZGC則是直接標記在指針上。

64位機器指針是64位,Linux下64位中高18位不能用來定址,剩下46位中,ZGC選擇其中4位用來輔助GC工作,另外42位能夠支持最大記憶體為4T,通常來說,4T的記憶體完全夠用。

具體來說,ZGC在指針中增加了4個標誌位,包括FinalizableRemappedMarked 0Marked 1

源碼註釋如下:

 6                 4 4 4  4 4                                             0
 3                 7 6 5  2 1                                             0
+-------------------+-+----+-----------------------------------------------+
|00000000 00000000 0|0|1111|11 11111111 11111111 11111111 11111111 11111111|
+-------------------+-+----+-----------------------------------------------+
|                   | |    |
|                   | |    * 41-0 Object Offset (42-bits, 4TB address space)
|                   | |
|                   | * 45-42 Metadata Bits (4-bits)  0001 = Marked0
|                   |                                 0010 = Marked1
|                   |                                 0100 = Remapped
|                   |                                 1000 = Finalizable
|                   |
|                   * 46-46 Unused (1-bit, always zero)
|
* 63-47 Fixed (17-bits, always zero)


Finalizable標識表示對象是否只能通過finalize()方法訪問到,RemappedMarked 0Marked 1用作三色標記(後面簡稱為M0M1)。

為什麼既有M0還有M1呢?

因為ZGC標記完成後並不需要等待對象指針重映射就可以進行下一次垃圾回收迴圈,也就是說兩次垃圾回收的全過程是有重疊的,所以使用兩個標記位分別用作兩次相鄰GC過程的標記,M0M1交替使用。

染色指針的在GC過程中的作用

我們通過紅藍黃三個顏色分別表示三種標記狀態:

1.第一次標記開始時所有的指針都處於Remapped狀態

  1. 從GC Root開始,順著對象圖遍歷掃描,存活對象標記為M0

  1. 標記完成後,開始進行併發重分配。最終目標是將A、B、C三個存活對象都移動到新的Region中去。

整個標記過程中新分配到對象都被直接標記為M0,比如對象D。

複製完成的對象,指針就可以由M0改為Remapped,並將舊對象到新對象到映射關係保存到轉發表中。

  1. 如果此時系統訪問對象C,會觸發讀屏障,將原引用修正到新的對象C的地址上去,並轉發訪問,最後刪除轉發表的記錄。

這個行為稱為指針的“自愈”。

實際上,如果沒有對象D的存在,在上一步所有存貨對象轉移完成後,舊的Page就可以被回收了,依靠指針和轉發表就可以將所有訪問轉發到新的Page中去。

  1. 併發重映射階段會把所有引用修正,並刪除轉發表的記錄。

  1. 下一次併發標記開始後,由於上一次垃圾回收迴圈並沒有完成,所以Remapped指針被標記為M1,用來和上一次的存活對象標記作區分。

可以看出,併發標記的過程中,ZGC是通過讀屏障來保證訪問的正確轉發,並且由於染色指針採用惰性更新的策略,相比Shenandoah每次都要先訪問轉髮指針的兩次定址來說快上不少。

染色指針的三大優點

1.由於染色指針提供的“自愈”能力,當某個Page被清除後可以立刻被回收,而無需等待修正全部指向該Page的引用。

2.ZGC完全不需要使用寫屏障,原因有二:由於使用染色指針,無需更新對象體;沒有分代所以無需記錄跨代引用。

3.染色指針並未完全開發使用,剩下的18位提供了非常大的擴展性。

而染色指針有一個天然的問題,就是操作系統和處理器並不完全支持程式對指針的修改。

多種記憶體映射

染色指針只是JVM定義的,操作系統、處理器未必支持。為瞭解決這個問題,ZGC在Linux/x86-64平臺上採用了虛擬記憶體映射技術。

ZGC為每個對象都創建了三個虛擬記憶體地址,分別對應RemappedMarked 0Marked 1,通過指針指向不同的虛擬記憶體地址來表示不同的染色標記。

分代

ZGC沒有分代,這一點並不是技術權衡,而是基於工作量的考慮。所以目前來看,整體的GC效率還有很大提升空間。

讀屏障

ZGC使用了讀屏障來完成指針的“自愈”,由於ZGC目前沒有分代,且ZGC通過掃描所有Region來省去卡表使用,所以ZGC並沒有寫屏障,這成為ZGC一大性能優勢。

NUMA

多核CPU同時操作記憶體就會發生爭搶,現代CPU把記憶體控制系統器集成到處理器內核中,每個CPU核心都有屬於自己的本地記憶體。

在NUMA架構下,ZGC會有現在自己的本地記憶體上分配對象,避免了記憶體使用的競爭。

在ZGC之前,只有Parallet Scavenge支持NUMA記憶體分配。

ZGC的運行步驟

ZGC和Shenadoah一樣,幾乎所有運行階段都和用戶線程併發進行。其中同樣包含初始標記、重新標記等STW的過程,作用相同,不再贅述。重點介紹以下四個併發階段:

併發標記

併發標記階段和G1相同,都是遍歷對象圖進行可達性分析,不同的是ZGC的標記在染色指針上。

併發預備重分配

在這個階段,ZGC會掃描所有Region,如果哪些Region裡面的存活對象需要被分配的新的Region中,就將這些Region放入重分配集中。

此外,JDK12後ZGC的類卸載和弱引用的處理也在這個階段。

併發重分配

ZGC在這個階段會將重分配集裡面的Region中的存貨對象複製到一個新的Region中,併為重分配集中每一個Region維護一個轉發表,記錄舊對象到新對象的映射關係。

如果在這個階段用戶線程併發訪問了重分配過程中的對象,並通過指針上的標記發現對象處於重分配集中,就會被讀屏障截獲,通過轉發表的內容轉發該訪問,並修改該引用的值。

ZGC將這種行為稱為自愈(Self-Healing),ZGC的這種設計導致只有在訪問到該指針時才會觸發一次轉發,比Shenandoah的轉髮指針每次都要轉發要好得多。

另一個好處是,如果一個Region中所有對象都複製完畢了,該Region就可以被回收了,只要保留轉發表即可。

併發重映射

最後一個階段的任務就是修正所有的指針並釋放轉發表。

這個階段的迫切性不高,所以ZGC將併發重映射合併到在下一次垃圾回收迴圈中的併發標記階段中,反正他們都需要遍歷所有對象。

總結

現代的垃圾回收器為了低停頓的目標可謂將“併發”二字玩到極致,Shenandoah在G1基礎上做了非常多的優化來使回收階段並行,而ZGC直接採用了染色指針、NUMA等黑科技,目的都是為了讓Java開發者可以更多的將精力放在如何使用對象讓程式更好的運行,剩下的一切交給GC,我們所做的只需享受現代化GC技術帶來的良好體驗。

參考:

1.OpenJDK 17 中的 Shenandoah:亞毫秒級 GC 停頓【譯】 - 知乎 (zhihu.com)

2.https://shipilev.net/talks/devoxx-Nov2017-shenandoah.pdf

3.https://openjdk.java.net/jeps/333


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原文地址: JavaFx 實現水平滾動文本(跑馬燈效果) - Stars-One的雜貨小窩 本文是以TornadoFx框架進行編寫,各位使用JavaFx可以參考 代碼已經封裝在common-controls庫中 效果 代碼 實現原理就是利用了JavaFx里的動畫效果去修改scrollpane的tra ...
  • Spire.Doc for C++ 是一個專業的 Word 庫,供開發人員在任何類型的 C++ 應用程式中閱讀、創建、編輯、比較和轉換 Word 文檔。 本文演示瞭如何以兩種不同的方式將 Spire.Doc for C++ 集成到您的 C++ 應用程式中。 通過 NuGet 安裝 Spire.Doc ...
  • Python語言中有6個標準數據類型。 不可變數據(3 個):Number(數字)、String(字元串)、Tuple(元組); 可變數據(3 個):List(列表)、Dictionary(字典)、Set(集合)。 有序數據:元組,列表 無序數據:集合,字典 數字number 整型int 正或負整數 ...
  • P1040 [NOIP2003 提高組] 加分二叉樹 - 洛谷 | 電腦科學教育新生態 (luogu.com.cn) 題意:給你一顆中序遍歷為1到n的二叉樹,和每個節點的val。樹的值=左子樹的值×右子樹的值+根的val,空樹值為1,求整個樹最大值和這個值樹的前序遍歷。 題解:區間dp。dp[l] ...
  • MySQL業務設計 作者: 博學谷狂野架構師 GitHub:GitHub地址 (有我精心準備的130本電子書PDF) 只分享乾貨、不吹水,讓我們一起加油!😄 邏輯設計 範式設計 範式概述 **第一範式:**當關係模式R的所有屬性都不能在分解為更基本的數據單位時,稱R是滿足第一範式的,簡記為1NF。 ...
  • 摘要:節點(Node)是通過 ROS 圖進行通信的可執行進程。 本文分享自華為雲社區《編寫一個簡單的發佈者和訂閱者》,作者: MAVER1CK 。 @[toc] 參考官方文檔:Writing a simple publisher and subscriber (C++) 背景 節點(Node)是通過 ...
  • 1. 簡介 在go中,slice是一種動態數組類型,其底層實現中使用了數組。slice有以下特點: *slice本身並不是數組,它只是一個引用類型,包含了一個指向底層數組的指針,以及長度和容量。 *slice的長度可以動態擴展或縮減,通過append和copy操作可以增加或刪除slice中的元素。 ...
  • 三種初始化數據域的方法: 在構造器中設置值 在聲明中賦值 初始化塊(initialization block) 初始化塊 在一個類的聲明中,可以包含多個代碼塊。只要構造類的對象,這些塊就會被執行。 class Employee { private static int nextId; private ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...