Java對象的"後事處理"——垃圾回收(二)

来源:https://www.cnblogs.com/zhangweicheng/archive/2019/11/08/11809376.html

1 先談Finalize() finalize()能做的所有工作,使用try-finally或者其他方式都可以做得更好、更及時,所以筆者建議大家完全可以忘掉Java語言中有這個方法的存在。 ——《深入理解JVM》 finalize()方法確實可以實現一次對象的自救,但是其不確定性和昂貴的運行代價都表 ...


1 先談Finalize()

finalize()能做的所有工作,使用try-finally或者其他方式都可以做得更好、更及時,所以筆者建議大家完全可以忘掉Java語言中有這個方法的存在。

——《深入理解JVM》

  finalize()方法確實可以實現一次對象的自救,但是其不確定性昂貴的運行代價都表明這個方法的使用需要十分的慎重。那麼finalize()在什麼時期起作用又是如何實現對象的自救的呢?首先我們要理解虛擬機在掃描到死亡對象的時候並不是直接回收的,而是進行一次標記並且篩選,篩選的條件就是其對象的finalize方法是否有必要執行。如果當前對象沒有重寫finalize方法或者已經調用過一次finalize方法,那麼則視為沒有必要執行,此時便失去自救的機會,放入"即將回收"集合中。

  否則的話,則將對象放入一個叫F-Queue的隊列中,稍後虛擬機將一個個的執行隊列中對象的finalize方法(就是在此處對象可以在finalize方法中將自身關聯到引用鏈,從而暫時逃脫被回收的命運),需要註意的是虛擬機保證執行但不保證執行完finalize方法,原因是如果finalize方法執行時間過長或者陷入死迴圈,則可能讓系統奔潰。全部執行之後,虛擬機將對隊列的對象重新標記一次,如果還不在引用鏈中則GG,否則將其移出"即將回收"集合。下麵例子參考《深入理解JVM》實現自救並且驗證只能自救一次的過程。

public class TestForGc {

    /** 定義一個根節點的靜態變數 */
    public static TestForGc INSTANCE;

    /**
     * 重寫finalize方法,讓其被標記為有必要執行並且加入F-Q
     *
     * @throws Throwable
     */
    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.err.println("finalize method in TestForGc Class invoked!");
        // 將自身關聯到根節點中,實現自救
        INSTANCE = this;
    }

    public static void main(String[] args) throws InterruptedException {
        INSTANCE = new TestForGc();

        INSTANCE = null;
        System.gc();
        // 睡眠1S,保證F-Q中的方法執行完畢
        TimeUnit.SECONDS.sleep(1);
        if (Objects.nonNull(INSTANCE)) {
            System.out.println("i successfully save myself by finalize method!");
        } else {
            System.out.println("i am dead :(");
        }

        /*
         * 下麵驗證finalize方法只能調用一次
         * 幾乎完全一樣的代碼,卻是不同的結局
         */
        INSTANCE = null;
        System.gc();
        // 睡眠1S
        TimeUnit.SECONDS.sleep(1);
        if (Objects.nonNull(INSTANCE)) {
            System.out.println("i successfully save myself by finalize method again!");
        } else {
            System.out.println("couldn't invoke finalize again, i am dead :(");
        }
    }
}
執行結果:

 2 垃圾回收器

  如果說回收演算法是介面,那麼垃圾回收器就是這些介面的實現類,共有7種回收器,接下來一一羅列。

2.1 Serial垃圾回收器

  Serial是一種單線程垃圾回收器,在工作的時候的時候會暫停所有的用戶線程,也就是"stop-the-world",雖然單線程代表了用戶線程的停頓,但是也意味著其不用進行線程的交互從而有更高的收集 效率。Serial採用複製演算法,是Client端新生代的預設垃圾回收器。其工作圖類似於:

2.2 ParNew垃圾回收器。

  ParNewSerial回收器的多線程版本,是Server端新生代的預設回收器,除了並行多線程之外,其他包括實現都是一模一樣,當然也是採用複製演算法。還有一點重要的是,新生代的收集器除了Serial之外,只有ParNew能跟年老代的CMS合作,其在低CPU的情況下效率比Serial低,但是在多個CPU的情況下要好的多。其工作圖:

2.3 Parallel Scavenge垃圾回收器

  跟ParNew類似,作用於新生代,並行多線程並且也是採用複製演算法。但是其關註的點卻不同,其著重的是一種叫做"吞吐量"的東西。所謂的"吞吐量"=運行用戶代碼的時間 / (運行用戶代碼的時間 + GC時間),也就是說其更加註重用戶代碼運行時間不是減少GC停頓時間。相對於其他收集器來說,可以更加高效的利用CPU,更加適合作為在後臺運算而不大需要交互的任務。Parallel收集器提供了兩個比較重要的參數。

-XX:MaxGCPauseMillis:表示收集器將儘可能的在這個參數設定的毫秒數內完成回收工作。但這並不代表其設置的越低越好,縮減回收時間是通過減少吞吐量換來的,如果設置得太低可能導致頻繁的GC。

-XX:GCTimeRatio:表示代碼運行時間和垃圾回收時間的比率,比如說設置為19,那麼則垃圾回收時間占比為 1 / (1+19) = 5%,預設是99。

2.4 Serial Old垃圾回收器

  Serial的年老代版本,同Serial基本相似,不同的是採用的是標記-整理演算法實現,作為Client端預設的年老代收集器。如果在Server端的話,那麼其主要作用有二:

 1、跟新生代的Parallel Scavenge收集器配合。

 2、做一個有價值的"備胎":當CMS垃圾回收器因為預留空間問題放不下對象而發生Concurrent Mode Fail時,作為其備選方案執行垃圾回收。

 

2.5 Parallel Old垃圾回收器

  Parallel Scavenge的年老代版本,多線程並行,同樣註重吞吐量,使用標記-整理演算法。這個收集器可以跟新生代的Parallel Svavenge一起搭配使用,在註重吞吐量和CPU資源敏感的場合中是一對很好的組合。

2.6 CMS垃圾回收器

  來了,它來了!CMS垃圾回收器被當做是具有劃時代意義的、真正實現併發的垃圾回收器,總而言之=》

  ,--^----------,--------,-----,-------^--,

  | ||||||||| `--------' | O

  `+---------------------------^----------|

  `\_,-------, _______________________強__|

  / XXXXXX /`| /

  / XXXXXX / `\ /

  / XXXXXX /\______(

  / XXXXXX /

  / XXXXXX /

  (________(

   `------'

  CMS是一款併發的垃圾回收器,但並不代表全程都不需要停頓,只是大部分時間是跟用戶線程一起執行的。其整個GC過程中總共有4個階段。

1、初始標記:簡單的標記所有的根節點,需要暫停所有的用戶線程,即"stop-the-world",耗時較短。關於GCRooots的過程可以看下另一篇文章——垃圾回收(一)

2、併發標記:跟用戶線程一起工作,尋找堆中的死亡對象,整個過程耗時最長。

3、重新標記:再次掃描,主要對象是併發標記過程中又新增的對象,也就是驗漏。多線程,需要STW,時間相對併發標記來說短。

4、併發清除:GC線程跟用戶線程一起執行,清除標記的死亡對象,"浮動垃圾"在此階段產生。

  然而,優秀如CMS也會有不足之處,總共四個階段的標記及清除演算法的實現必定為其帶來一些使用的麻煩。

缺點:

  1、占用一定CPU資源:其有兩個階段需要併發跟用戶線程一起執行,也就是說要跟用戶線程搶占CPU的時間片,會占用一定的CPU資源,如果CPU資源不太優質的情況下,可能會造成不小的影響。

  2、空間利用率不能達到最大:由於併發清除時用戶線程也在運行,那麼在GC結束前必定會產生一些額外的垃圾,那麼就必須給這些垃圾預留一定的空間,否則會導致記憶體不足從而報"Concurrent Mode Failure",此時虛擬機便啟用後備方案——使用Serial Old來進行垃圾回收,進而浪費更多的時間。

  3、記憶體碎片導致提前FullGC:CMS採用的是標記-清除演算法,也就是說會產生記憶體碎片,那麼可能出現大對象放不下的情況,進而不得不提前進行一次FullGC。為瞭解決這個問題,虛擬機提供了兩個參數-XX:+UseCMSCompactAtFullCollection-XX:CMSFullGCsBeforeCompaction,分別表示CMS頂不住要進行FullGC的時候進行記憶體的整理(整理的過程中無法併發,停頓時間不得不變長) 和進行多少次不壓縮的FullGC之後來一次整理的GC(預設0次,表示每次都進行記憶體整理)。

2.7 G1垃圾回收器

  G1是一個新秀垃圾回收器,被賦予了很大的使命——取代CMS。G1作為新時代的垃圾回收器,相對於其他垃圾回收器來說有許多優勢。

1、並行和併發:G1可以利用現在的硬體優勢,縮短GC時stop-the-world的停頓時間,並且GC的時候同時也能讓用戶線程執行。

2、分代收集:跟其他垃圾回收器不同,G1沒有物理上的年老代和新生代,其將記憶體分成了多個獨立的Region,每個Region都可能表示屬於新生代還是年老代,所以不需要一堆Region湊放在一起然後將這塊區域稱作新生代,它們之間並不需要連續,所以只有概念上的分代,也是這種分代方式使得G1可以獨立管理這個堆空間,不需要跟其他回收器合作。

3、空間整合:G1的演算法從Region層面看屬於複製演算法(從一個Region複製到另一個),但是從整體看又是標記-整理法。然而不管是哪種,都表示G1不會產生記憶體碎片,不會因為空間不連續放不下大對象而出現FullGC的情況。

  G1回收器將記憶體空間分成若幹個Region,並且這些Region之前相互獨立。但是我們都知道這並不能真正的獨立,因為一個Region中的對象不一定只會被當前Region的其他對象引用,而可能被堆中的其他對象引用,那G1是如何實現避免全堆掃描的呢?這個問題在分代的其他回收器中也有,但是在這裡突顯得更加明顯而已。再G1中,對象本身都會有一個Remembered Set,這個Set存放著當前對象被其他區域對象引用的信息,這樣子,在掃描引用的時候加上這個Set就可以避免全堆掃描了。

  具體實現大致為:虛擬機在發現程式正在進行對Reference類型的寫操作時,會暫時中斷寫操作,然後檢查Reference引用的對象是否處於不同的區域如果是分代,則只對年老代的對象進行檢查,檢查是否引用的對象在新生代),如果是的話則將引用信息記錄在被引用的Remembered Set中,這樣在GC的時候加上Remembered Set的掃描就可以避免全堆掃描了。

  跟CMS類型,G1也有四個階段(不算Remembered Set的掃描),雖然相似但是還是有些區別的。

1、初始標記:標記可達的根節點,STW,單線程,時間短。

2、併發標記:跟用戶線程同時執行,併發執行時對象可能會產生引用變化,其會將這些變化記錄在Remembered Set Logs中,待下個階段整合。

3、最終標記:驗漏,將併發標記階段的引用變化記錄Remembered Set Logs整合到Remembered Set中。

4、篩選回收:對各個Region中的回收價值進行排序,然後執行回收計劃。暫停用戶線程,並行執行。 

3 小結

  本文首先介紹了“對象自救”的方法——finalize,並且用一個小例子演示了對象如何實現自救。接著介紹了7種不同的垃圾回收器,新生代中有單線程的Serial可以作為Client端新生代的預設回收器,有多線程版本的Serial——ParNew,還有著重點不同(吞吐量)的Parallel Scavenge;年老代方面有單線程的Serial Old、跨時代意義的併發回收器——CMS,雖然優秀但不可避免的有三個缺點、還有吞吐量年老代版本——Parallel Old收集器,最後還簡單介紹了G1收集器的幾個過程還有獨立的Region間是如何實現避免堆掃描的。

  整體下來整篇行文還有些粗糙,日後會慢慢的圓潤,如果有關於這方面好的文章可以在下麵評論區分享學習一下,下方為各個垃圾回收器的搭配圖。

 

 

It helps me a lot if you could share your opinion with us.


您的分享是我們最大的動力!

更多相關文章
  • 通過前面2篇文章我們搭建了SW的基礎環境,監控了微服務,能瞭解所有服務的運行情況。但是當出現服務響應慢,介面耗時嚴重時我們需要立即定位到問題,這就需要我們今天的主角 監控告警,同時此篇也是SW系列的最後一篇。 UI參數 首先我們認識一下SW DashBoard上的幾個關鍵參數,如下圖所示 告警配置 ...
  • 一.docker簡介 1、docker定義:docker是一個用來裝應用的容器,就像杯子可以裝水,筆筒可以裝筆,書包可以放書一樣。你可以把“Hello World!”放到docker中,也可以把網站放到docker中,你可以把任何你想到的程式放到docker中。 2、docker思想: (1)集裝箱 ...
  • 智力題目有三個容積分別為3升、5升、8升的水桶,其中容積為8升的水桶中裝滿了水,容積為3升和容積為5升的水桶都是空的。三個水桶都沒有刻度,現在需要將大水桶中的8升水等分成兩份,每份都是4升水,附加條件是只能這三個水桶,不能藉助其他輔助容器。“恩,是的,這是一個很經典的問題。”“然而,我們並不能想全, ...
  • 今天,在Anaconda prompt啟動python遇到瞭如下錯誤: UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaf in position 553: illegal multibyte sequence 看了看出錯跟蹤,查看瞭如下位置 ...
  • 許多小伙伴對於java中的三種初始化塊的執行順序一直感到頭疼,接下來我們就來分析一下這三種初始化塊到底是怎麼運行的。有些公司也會將這個問題作為筆試題目。 下麵通過一段代碼來看看創建對象時這麼初始化塊是如何運行的 package com.hxy; public class CodeBlock{ pub ...
一周排行
  • 1. 運行效果 在 "使用GetAlphaMask和ContainerVisual製作長陰影(Long Shadow)" 這篇文章里我介紹了一個包含長陰影的番茄鐘,這個番茄鐘在狀態切換時用到了翻轉動畫,效果如上所示,還用到了彈簧動畫,可以看到翻轉後有點回彈。本來打算自己這個動畫效果寫的,但火火已經寫 ...
  • 接上一篇,es部署很簡單,很快就弄好了。 但是還是有很多不玩美。 比如說:主機是本地的IP或機器名,埠是固定的9200. 而且是只有一個節點,我要在一臺機器上部署多個節點呢。 經過一段時間的摸索,做起來也很簡單,但過程切實很痛苦。 具體做法是:你想部署多少個節點,你就重覆多少次上一步的做法。啟動就 ...
  • 在項目中,需要為所有的Button、TextBox設置一個預設的全局樣式,一個個的為多個控制項設置相同的樣式顯然是不明智的。在WPF中可以通過資源設置全局樣式,主要有倆種方法: 1.第一種就是先寫好按鈕的樣式,不寫Key,然後在App.xaml中引用。 <ResourceDictionary xmln ...
  • 說明:該篇隨筆的代碼內容並非出自本人,是在其他網站搜尋的,出處已經不記得了,本次隨筆只為記錄,目的幫助自己,幫助他人。 實現的原理也不做多的贅述,直接上代碼。 第一個類是需要用到的Windows API public class Win32Api { [StructLayout(LayoutKind ...
  • 前言 在ASP.Net Core2.X調用的CreateWebHostBuilder和3.X的主要區別在於WebHost的調用,CreateDefaultBuilder被Host替換,另一個區別是對ConfigureWebHostDefaults()的調用; 由於新的主機生成器是通用主機生成器,因此 ...
  • 對於開發人員來說,常常需要在不藉助任何Microsoft Office及其他第三方軟體的情況下,打開、創建、修改、轉換、列印、瀏覽(Word、Excel、PowerPoint和PDF等)文檔,以及將數據從數據源轉換為常用的文檔格式,甚至一些其他的文檔操作。 在這裡,小編調查了業內許多開發人員,為大家 ...
  • 這次的目標是實現通過標註Attribute實現緩存的功能,精簡代碼,減少緩存的代碼侵入業務代碼。 緩存內容即為Service查詢彙總的內容,不做其他高大上的功能,提升短時間多次查詢的響應速度,適當減輕資料庫壓力。 在做之前,也去看了EasyCaching的源碼,這次的想法也是源於這裡,AOP的方式讓 ...
  • 例如想獲取尾碼名為.txt的文件 第一種方法獲取到的是對應的文件路徑 第二種方法可以獲取到文件的一些詳細信息 類似於"*.txt" 要與路徑中的文件名匹配的搜索字元串。這個參數可以包含有效的文本路徑和通配符(*和?)的組合人物,但它不支持正則表達式。 我是參照此路徑編寫的博客,用於自己查詢快速 ht ...
  • 我們在開發中Json傳輸數據日益普遍,有很多關於Json字元串的序列化和反序列化的文章大多都告訴你怎麼用,但是卻不會告訴你用什麼更高效。因為有太多選擇,人們往往會陷入選擇難題。 相比.NET Framework有三種選擇而.net core下已經沒有JavaScriptSerializer,但是大家 ...
  • c#微信公眾號開發 基本設置 參考微信官方文檔 https://developers.weixin.qq.com/doc/offiaccount/Basic_Information/Access_Overview.html 開發→基本配置 公眾號開發信息 註:1.記錄好開發者密碼,會在程式中驗證過程 ...
x