扒一扒JVM的垃圾回收機制,下次面試你準備好了嗎

来源:https://www.cnblogs.com/1024Community/archive/2018/03/18/honery.html
-Advertisement-
Play Games

相信和小編一樣的程式猿們在日常工作或面試當中經常會遇到JVM的垃圾回收問題,有沒有在夜深人靜的時候詳細捋一捋JVM垃圾回收機制中的知識點呢?沒時間捋也沒關係,因為小編接下來會給你捋一捋。 ...


  相信和小編一樣的程式猿們在日常工作或面試當中經常會遇到JVM的垃圾回收問題,有沒有在夜深人靜的時候詳細捋一捋JVM垃圾回收機制中的知識點呢?沒時間捋也沒關係,因為小編接下來會給你捋一捋。

一、 技術背景你要瞭解吧

  按照套路是要先裝裝X,談談JVM垃圾回收的前世今生的。說起垃圾回收(GC),大部分人都把這項技術當做Java語言的伴生產物。事實上,GC的歷史比Java久遠,早在1960年Lisp這門語言中就使用了記憶體動態分配和垃圾回收技術。設計和優化C++這門語言的專家們要長點心啦~~

二、 哪些記憶體需要回收?

  猿們都知道JVM的記憶體結構包括五大區域:程式計數器、虛擬機棧、本地方法棧、堆區、方法區。其中程式計數器、虛擬機棧、本地方法棧3個區域隨線程而生、隨線程而滅,因此這幾個區域的記憶體分配和回收都具備確定性,就不需要過多考慮回收的問題,因為方法結束或者線程結束時,記憶體自然就跟隨著回收了。而Java堆區和方法區則不一樣、不一樣!(怎麼不一樣說的朗朗上口),這部分記憶體的分配和回收是動態的,正是垃圾收集器所需關註的部分。

  垃圾收集器在對堆區和方法區進行回收前,首先要確定這些區域的對象哪些可以被回收,哪些暫時還不能回收,這就要用到判斷對象是否存活的演算法!(面試官肯定沒少問你吧)

2.1 引用計數演算法

2.1.1 演算法分析

  引用計數是垃圾收集器中的早期策略。在這種方法中,堆中每個對象實例都有一個引用計數。當一個對象被創建時,就將該對象實例分配給一個變數,該變數計數設置為1。當任何其它變數被賦值為這個對象的引用時,計數加1(a = b,則b引用的對象實例的計數器+1),但當一個對象實例的某個引用超過了生命周期或者被設置為一個新值時,對象實例的引用計數器減1。任何引用計數器為0的對象實例可以被當作垃圾收集。當一個對象實例被垃圾收集時,它引用的任何對象實例的引用計數器減1。

2.1.2 優缺點

優點:引用計數收集器可以很快的執行,交織在程式運行中。對程式需要不被長時間打斷的實時環境比較有利。

缺點:無法檢測出迴圈引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能為0。

2.1.3 是不是很無趣,來段代碼壓壓驚

public class ReferenceFindTest {
    public static void main(String[] args) {
        MyObject object1 = new MyObject();
        MyObject object2 = new MyObject();
          
        object1.object = object2;
        object2.object = object1;
          
        object1 = null;
        object2 = null;
    }
}

  這段代碼是用來驗證引用計數演算法不能檢測出迴圈引用。最後面兩句將object1object2賦值為null,也就是說object1object2指向的對象已經不可能再被訪問,但是由於它們互相引用對方,導致它們的引用計數器都不為0,那麼垃圾收集器就永遠不會回收它們。

2.2 可達性分析演算法

  可達性分析演算法是從離散數學中的圖論引入的,程式把所有的引用關係看作一張圖,從一個節點GC ROOT開始,尋找對應的引用節點,找到這個節點以後,繼續尋找這個節點的引用節點,當所有的引用節點尋找完畢之後,剩餘的節點則被認為是沒有被引用到的節點,即無用的節點,無用的節點將會被判定為是可回收的對象。

  在Java語言中,可作為GC Roots的對象包括下麵幾種:

  a) 虛擬機棧中引用的對象(棧幀中的本地變數表);

  b) 方法區中類靜態屬性引用的對象;

  c) 方法區中常量引用的對象;

  d) 本地方法棧中JNI(Native方法)引用的對象。

2.3 Java中的引用你瞭解多少

  無論是通過引用計數演算法判斷對象的引用數量,還是通過可達性分析演算法判斷對象的引用鏈是否可達,判定對象是否存活都與“引用”有關。在Java語言中,將引用又分為強引用、軟引用、弱引用、虛引用4種,這四種引用強度依次逐漸減弱。

  • 強引用

  在程式代碼中普遍存在的,類似 Object obj = new Object() 這類引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的對象。

  • 軟引用

  用來描述一些還有用但並非必須的對象。對於軟引用關聯著的對象,在系統將要發生記憶體溢出異常之前,將會把這些對象列進回收範圍之中進行第二次回收。如果這次回收後還沒有足夠的記憶體,才會拋出記憶體溢出異常。

  • 弱引用

  也是用來描述非必需對象的,但是它的強度比軟引用更弱一些,被弱引用關聯的對象只能生存到下一次垃圾收集發生之前。當垃圾收集器工作時,無論當前記憶體是否足夠,都會回收掉只被弱引用關聯的對象。

  • 虛引用

  也叫幽靈引用或幻影引用(名字真會取,很魔幻的樣子),是最弱的一種引用關係。一個對象是否有虛引用的存在,完全不會對其生存時間構成影響,也無法通過虛引用來取得一個對象實例。它的作用是能在這個對象被收集器回收時收到一個系統通知。

  不要被概念嚇到,也別擔心,還沒跑題,再深入,可就不好說了。小編羅列這四個概念的目的是為了說明,無論引用計數演算法還是可達性分析演算法都是基於強引用而言的。

2.4 對象死亡(被回收)前的最後一次掙扎

  即使在可達性分析演算法中不可達的對象,也並非是“非死不可”,這時候它們暫時處於“緩刑”階段,要真正宣告一個對象死亡,至少要經歷兩次標記過程。

  第一次標記:如果對象在進行可達性分析後發現沒有與GC Roots相連接的引用鏈,那它將會被第一次標記;

  第二次標記:第一次標記後接著會進行一次篩選,篩選的條件是此對象是否有必要執行finalize()方法。在finalize()方法中沒有重新與引用鏈建立關聯關係的,將被進行第二次標記。

  第二次標記成功的對象將真的會被回收,如果對象在finalize()方法中重新與引用鏈建立了關聯關係,那麼將會逃離本次回收,繼續存活。猿們還跟的上吧,嘿嘿。

2.5 方法區如何判斷是否需要回收

  猿們,方法區存儲內容是否需要回收的判斷可就不一樣咯。方法區主要回收的內容有:廢棄常量和無用的類。對於廢棄常量也可通過引用的可達性來判斷,但是對於無用的類則需要同時滿足下麵3個條件:

  • 該類所有的實例都已經被回收,也就是Java堆中不存在該類的任何實例;
  • 載入該類的ClassLoader已經被回收;
  • 該類對應的java.lang.Class對象沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。



講了半天,主角終於要粉墨登場了。


三、常用的垃圾收集演算法

3.1 標記-清除演算法

  標記-清除演算法採用從根集合(GC Roots)進行掃描,對存活的對象進行標記,標記完畢後,再掃描整個空間中未被標記的對象,進行回收,如下圖所示。標記-清除演算法不需要進行對象的移動,只需對不存活的對象進行處理,在存活對象比較多的情況下極為高效,但由於標記-清除演算法直接回收不存活的對象,因此會造成記憶體碎片。

3.2 複製演算法

  複製演算法的提出是為了剋服句柄的開銷和解決記憶體碎片的問題。它開始時把堆分成 一個對象 面和多個空閑面, 程式從對象面為對象分配空間,當對象滿了,基於copying演算法的垃圾 收集就從根集合(GC Roots)中掃描活動對象,並將每個 活動對象複製到空閑面(使得活動對象所占的記憶體之間沒有空閑洞),這樣空閑面變成了對象面,原來的對象面變成了空閑面,程式會在新的對象面中分配記憶體。

3.3 標記-整理演算法

  標記-整理演算法採用標記-清除演算法一樣的方式進行對象的標記,但在清除時不同,在回收不存活的對象占用的空間後,會將所有的存活對象往左端空閑空間移動,並更新對應的指針。標記-整理演算法是在標記-清除演算法的基礎上,又進行了對象的移動,因此成本更高,但是卻解決了記憶體碎片的問題。具體流程見下圖:

3.4 分代收集演算法

  分代收集演算法是目前大部分JVM的垃圾收集器採用的演算法。它的核心思想是根據對象存活的生命周期將記憶體劃分為若幹個不同的區域。一般情況下將堆區劃分為老年代(Tenured Generation)和新生代(Young Generation),在堆區之外還有一個代就是永久代(Permanet Generation)。老年代的特點是每次垃圾收集時只有少量對象需要被回收,而新生代的特點是每次垃圾回收時都有大量的對象需要被回收,那麼就可以根據不同代的特點採取最適合的收集演算法。

3.4.1 年輕代(Young Generation)的回收演算法

a) 所有新生成的對象首先都是放在年輕代的。年輕代的目標就是儘可能快速的收集掉那些生命周期短的對象。

b) 新生代記憶體按照8:1:1的比例分為一個eden區和兩個survivor(survivor0,survivor1)區。一個Eden區,兩個 Survivor區(一般而言)。大部分對象在Eden區中生成。回收時先將eden區存活對象複製到一個survivor0區,然後清空eden區,當這個survivor0區也存放滿了時,則將eden區和survivor0區存活對象複製到另一個survivor1區,然後清空eden和這個survivor0區,此時survivor0區是空的,然後將survivor0區和survivor1區交換,即保持survivor1區為空, 如此往複。

c) 當survivor1區不足以存放 eden和survivor0的存活對象時,就將存活對象直接存放到老年代。若是老年代也滿了就會觸發一次Full GC,也就是新生代、老年代都進行回收。

d) 新生代發生的GC也叫做Minor GC,MinorGC發生頻率比較高(不一定等Eden區滿了才觸發)。

3.4.2 年老代(Old Generation)的回收演算法

a) 在年輕代中經歷了N次垃圾回收後仍然存活的對象,就會被放到年老代中。因此,可以認為年老代中存放的都是一些生命周期較長的對象。

b) 記憶體比新生代也大很多(大概比例是1:2),當老年代記憶體滿時觸發Major GC即Full GC,Full GC發生頻率比較低,老年代對象存活時間比較長,存活率標記高。

3.4.3 持久代(Permanent Generation)的回收演算法

  用於存放靜態文件,如Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動態生成或者調用一些class,例如Hibernate 等,在這種時候需要設置一個比較大的持久代空間來存放這些運行過程中新增的類。持久代也稱方法區,具體的回收可參見上文2.5節。



猿們加油跟上,離offer不遠啦!!!


四、常見的垃圾收集器

下麵一張圖是HotSpot虛擬機包含的所有收集器,圖是借用過來滴:

  • Serial收集器(複製演算法)
    新生代單線程收集器,標記和清理都是單線程,優點是簡單高效。是client級別預設的GC方式,可以通過-XX:+UseSerialGC來強制指定。
  • Serial Old收集器(標記-整理演算法)
    老年代單線程收集器,Serial收集器的老年代版本。
  • ParNew收集器(停止-複製演算法) 
    新生代收集器,可以認為是Serial收集器的多線程版本,在多核CPU環境下有著比Serial更好的表現。
  • Parallel Scavenge收集器(停止-複製演算法)
    並行收集器,追求高吞吐量,高效利用CPU。吞吐量一般為99%, 吞吐量= 用戶線程時間/(用戶線程時間+GC線程時間)。適合後臺應用等對交互相應要求不高的場景。是server級別預設採用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數。
  • Parallel Old收集器(停止-複製演算法)
    Parallel Scavenge收集器的老年代版本,並行收集器,吞吐量優先。
  • CMS(Concurrent Mark Sweep)收集器(標記-清理演算法)
    高併發、低停頓,追求最短GC回收停頓時間,cpu占用比較高,響應時間快,停頓時間短,多核cpu 追求高響應時間的選擇。

五、GC是什麼時候觸發的(面試最常見的問題之一)

  由於對象進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。

5.1 Scavenge GC

  一般情況下,當新對象生成,並且在Eden申請空間失敗時,就會觸發Scavenge GC,對Eden區域進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的演算法,使Eden去能儘快空閑出來。

5.2 Full GC

  對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,所以比Scavenge GC要慢,因此應該儘可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於Full GC的調節。有如下原因可能導致Full GC:

a) 年老代(Tenured)被寫滿;

b) 持久代(Perm)被寫滿;

c) System.gc()被顯示調用;

d) 上一次GC之後Heap的各域分配策略動態變化;

結束語

  內容的完整度和深度在一篇博文裡面真的很難全部考慮,本文做了很大嘗試,最後還是得投降。對於各個垃圾收集器的區別、運行過程中各記憶體區域參數的設置、GC日誌的查看等內容後續再補上吧。文章概念很多,也借用了一些書籍和博文的經典總結,算是一個知識點整理後的輸出吧,希望對大家有所裨益。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 閉包(closure)是Javascript語言的一個難點,也是它的特色,很多高級應用都要依靠閉包實現。 下麵就是我的學習筆記,對於Javascript初學者應該是很有用的。 一、變數的作用域 要理解閉包,首先必須理解Javascript特殊的變數作用域。 變數的作用域無非就是兩種:全局變數和局部變 ...
  • 開始接觸不太清楚rtmp協議的流,後來折騰了一番採用了videojs的插件下麵是案例 videojs案例 剛開始採用的是videojs的形式展示rtmp流媒體視頻的,後面發win10的谷歌不相容然後採用了flowplayer的插件播放 ...
  • Cas的全稱是Centeral Authentication Service,是對單點登錄SSO(Single Sign On)的一種實現。其由Cas Server和Cas Client兩部分組成,Cas Server是核心,而Cas Client通常就對應於我們的應用。一個Cas Server可以 ...
  • 6.1.2 介面不是類,不能實例化一個介面;但是可以聲明介面的變數;Comparable x; 介面變數必須引用實現了介面的類對象;x = new Employee(); 檢查一個對象是否屬於某個特定類(instanceof); 檢查一個對象是否屬於某個特定的介面(instance);if (anO ...
  • webService入門 Web service是一個平臺獨立的,低耦合的,自包含的、基於可編程的web的應用程式,可使用開放的XML(標準通用標記語言下的一個子集)標準來描述、發佈、發現、協調和配置這些應用程式,用於開發分散式的互操作的應用程式。[1] Webservice跨平臺跨語言; Java... ...
  • WebService介紹 首先我們來談一下為什麼需要學習webService這樣的一個技術吧.... 問題一 如果我們的網站需要提供一個 天氣預報 這樣一個需求的話,那我們該怎麼做????? 天氣預報這麼一個功能並不是簡單的JS組件就能夠實現的,它的數據是依賴資料庫分析出來的,甚至需要衛星探測..我 ...
  • c/s是客戶機/伺服器,b/s是瀏覽器/伺服器。 ipv4 192.168.....(內網ip) 通過路由器的NAT(維護了一張表,用來轉換ip對應外網)。 當ipv6推廣開,就不用使用路由器了。 通信原理: 寫ip地址訪問太麻煩,於是有了功能變數名稱,它會先訪問本地的hosts,沒有則去網路訪問DNS服務 ...
  • 一 、 前言 Django 提供了admin 組件 為項目提供基本的管理後臺功能(對數據表的增刪改查)。 本篇文章通過 admin源碼 簡單分析admin 內部原理 ,擴展使用方式,為以後進行定製和自己開發組件做鋪墊。 二、 簡單使用 1.在app 目錄下的admin.py 中通過註冊表 2. 創建 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...