通常,我們在寫java程式的時候,似乎很少關註記憶體分配和垃圾回收的問題。因為,這部分工作,JVM已經幫我們自動實現了。 這樣看起來,好像很美好,但是任何事情都有兩面性。雖然JVM會自動的進行垃圾回收,但是,如果遇到有些問題,JVM自己也處理不了呢? 因此,我們需要瞭解一下JVM垃圾回收是怎樣運作的, ...
通常,我們在寫java程式的時候,似乎很少關註記憶體分配和垃圾回收的問題。因為,這部分工作,JVM已經幫我們自動實現了。
這樣看起來,好像很美好,但是任何事情都有兩面性。雖然JVM會自動的進行垃圾回收,但是,如果遇到有些問題,JVM自己也處理不了呢?
因此,我們需要瞭解一下JVM垃圾回收是怎樣運作的,這樣才能在遇到問題的時候,有的放矢。所以,今天就來聊一聊JVM的垃圾回收吧。
首先,思考一下,為什麼需要進行垃圾回收?
我們知道,在創建對象的時候,Java會把對象的內容放到堆中。隨著時間的推移,堆中的對象肯定會越來越多,但是,堆的大小是有限制的。如果,我們不進行垃圾回收,也就是把無用的對象進行清除和回收,那麼JVM將不堪重負,最終導致記憶體泄漏。
既然我們需要進行垃圾回收,那麼,首先得知道什麼是垃圾。
在垃圾收集器對堆記憶體進行回收前,會先判斷哪些對象還在“存活”,哪些對象已經“死去”(即不可能再被任何途徑使用的對象),這些“死去”的對象,就是我們需要進行回收的垃圾。
那麼,通過什麼方式去判定是否為垃圾呢?(即判定對象是否存活)
引用計數演算法(已淘汰)
引用計數演算法,是指給對象中添加一個引用計數器,每當有一個地方引用它時,計數器的值就加1,當引用失效時,計數器的值就減1。當計數器值為0時,該對象就會被回收。
可以說,引用計數演算法的實現非常簡單,判定效率也很高。但是,我們忽略了一個問題,在Java中,對象之間是可以互相迴圈引用的。如果,兩個對象之間互相迴圈引用,那麼就會導致,它們之間的引用計數都不為0(都在等待對方釋放資源),因此,就無法通知垃圾收集器回收它們。
可達性分析演算法
這個演算法的思想就是,通過一系列被稱為“GC Roots”的對象作為起點,然後向下搜索,所走過的路徑被稱為引用鏈。當一個對象到 GC Roots之間沒有任何引用鏈時(即從GC Roots到該對象不可達),則證明該對象是不可用的。
這個演算法解決了迴圈引用的問題,只要對象無法與GC Root之間建立直接或間接的連接,就會判定為可回收對象。
那麼,什麼對象可以作為GC Root呢?一般分為以下四種:
- 虛擬機棧(棧幀中的本地變數表)中引用的對象。
- 方法區中類靜態屬性引用的對象。
- 方法區中常量引用的對象。
- 本地方法棧中引用的對象。
既然已經確定了哪些垃圾可以被回收,那麼就需要垃圾收集器進行垃圾回收了,我們來瞭解一下幾種比較常見的的垃圾收集演算法。
標記清除演算法
是最基礎的一種收集演算法,分為標記和清除兩個階段。首先,把需要回收的對象標記出來,然後再把他們清除掉。如上圖所示,所有可回收的對象會變成未使用的一片區域。
標記清除演算法邏輯清晰,易於操作。但是,我們可以看到,未使用的記憶體區塊都不是連續的,因此,此演算法會產生很多的記憶體碎片。這樣,當一些較大的對象需要分配空間的時候,就找不到足夠的連續記憶體來存儲,因此會提前觸發GC,同時也浪費了很多的記憶體空間(記憶體空間太小,導致不可用)。
複製演算法
複製演算法,是指把記憶體區域劃分為大小相等的兩塊區域。每次只使用其中的一塊,當這一塊記憶體用完了,就把所有存活的對象複製到另一塊上面,最後再把已使用過的記憶體空間一次清理掉。
這樣,就可以保證記憶體區域的連續性,不會產生記憶體碎片,實現簡單,運行高效。但是,這樣的話只有使用原來一半的記憶體,代價也太高了。
標記整理演算法
標記整理演算法,標記過程和標記清除演算法一樣,但是後續不是進行清除,而是先整理,讓所有存活的對象都向一端移動,然後再清除另一端的記憶體區域。
標記整理演算法解決了標記清除演算法產生記憶體碎片的問題,同時也解決了複製演算法只能利用一半記憶體的問題,看似是非常的完美。但是,它卻產生了另外一個問題。可以看到圖中,記憶體的變動非常頻繁,每次整理都有很多存活的對象記憶體地址發生改變。因此,它的效率會慢很多。
所以,現在一般用分代收集演算法。在Java堆中,分為新生代和老年代,可以根據各個代的特點,選擇最合適的收集演算法。新生代中,每次垃圾收集都有大批對象死去,只有少量對象存活,就可以選擇複製演算法,只需要付出少量存活對象的複製成本即可。而老年代中,對象存活率高,沒有額外空間對它進行分配擔保,因此使用標記清除或者標記整理演算法。
堆記憶體模型
Java堆是記憶體管理中最大的一塊區域,也是垃圾回收的重點區域。堆分為新生代、老年代和永久代,新生代又分為Eden區和Survivor區,Survivor又分為S0和S1區。在JDK1.8之後把永久代移除了,而用元空間代替。(永久代使用的是堆記憶體,而元空間直接使用本機物理記憶體)
新生代中的對象98%都是朝生夕死的,因此把新生代分為較大的一塊Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中的一塊Survivor(此處Survivor區也叫From區,另一塊空的未使用的空間叫To區,From和To區是會交換的,保證空的總是To區)。
當Eden區沒有足夠的空間分配時,會進行一次Minor GC,Eden區大部分對象都被回收,而Eden區和From區存活的對象會放入到To區,然後From和To區進行交換。(如果To區空間不夠,直接進入老年代)
以下幾種情況會進入老年代。
1) 大對象
大對象就是指需要大量連續記憶體空間的對象,最典型的就是那種很長的字元串和數組。大對象會直接進入到老年代,這樣做的目的主要是為了避免新生代發生大量的記憶體複製(大對象的複製成本較高)。
2)長期存活的對象
虛擬機給每個對象都定義了一個對象年齡計數器。每當進行一次Minor GC,年齡就增加1歲,當年齡超過一定值時(預設是15,可以通過參數配置),就進入到老年代。
3)動態對象年齡判斷
虛擬機並不要求對象年齡一定要到達15歲才進入到老年代。如果Survivor空間中有某年齡相同的所有對象大小總和大於Survivor空間的一半,則年齡大於等於該年齡的對象就會直接進入老年代。
空間分配擔保
在發生Minor GC之前,虛擬機會檢查老年代最大可用的連續空間是否大於新生代所有對象總空間,如果大於,那麼Minor GC可以確保是安全的(因為,極端情況下,就算新生代所有對象都存活,也可以保證安全晉升到老年代)。否則,虛擬機會查看HandlePromotionFailure的值是否允許擔保失敗。如果允許,那麼會繼續檢查老年代最大可用的連續空間是否大於歷次晉升到老年代對象的平均大小。如果大於,將嘗試進行一次Minor GC(儘管有風險);如果小於或者HandlePromotionFailure設置不允許冒險,那麼就先進行一次Full GC。
以上說的有風險,是因為取歷次晉升到老年代對象的平均值這種方式只是經驗值,並不能保證每次都能擔保成功,如果擔保成功還好,如果擔保失敗的話,依然需要進行Full GC。
儘管如此,我們最好還是打開HandlePromotionFailure開關,避免過多頻繁的Full GC(因為Full GC的執行速度比Minor GC慢的多)。