參考:《深入理解JAVA虛擬機》第二版 3.3 垃圾收集演算法 由於垃圾收集演算法的實現涉及大量的程式細節,而且各個平臺的虛擬機操作記憶體的方法又各不相同,只是介紹幾種演算法的思想及其發展過程。 3.3.1 標記 清除演算法 最基礎的收集演算法是“標記 清除”(Mark Sweep)演算法。 演算法分為 標記和清除 ...
參考:《深入理解JAVA虛擬機》第二版
3.3 垃圾收集演算法
由於垃圾收集演算法的實現涉及大量的程式細節,而且各個平臺的虛擬機操作記憶體的方法又各不相同,只是介紹幾種演算法的思想及其發展過程。
3.3.1 標記-清除演算法
最基礎的收集演算法是“標記-清除”(Mark-Sweep)演算法。
演算法分為標記和清除兩個階段:首先標記出所有需要回收的對象,在標記完成後統一回收所有被標記的對象。後續的收集演算法都是基於這種思路並對其不足進行改進而得到的。
它的主要不足有兩個:
- 一個是效率問題,標記和清除兩個過程的效率都不高;
- 一個是空間問題,標記清除之後會產生大量不連續的記憶體碎片,空間碎片太多可能會導致以後在程式運行過程中需要分配較大對象時,無法找到足夠的連續記憶體而不得不提前觸發另一次垃圾收集動作。
3.3.2 複製演算法
為瞭解決效率問題,“複製”(Copying)的收集演算法出現了,它將可用記憶體按容量劃分為大小相等的兩塊,每次只使用其中的一塊。當這一塊的記憶體用完了,就將還存活著的對象複製到另外一塊上面,然後再把已使用過的記憶體空間一次清理掉。
這樣使得每次都是對整個半區進行記憶體回收,不用考慮記憶體碎片等複雜情況,實現簡單,運行高效。這種演算法的代價是將記憶體縮小為了原來的一半,未免太高了一點。
現在的商業虛擬機都採用這種收集演算法來回收新生代,IBM研究表明,新生代中的對象98%是“朝生夕死”的,所以並不需要按照1:1的比例來劃分記憶體空間,而是將記憶體分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。
當回收時,將Eden和Survivor中還存活著的對象一次性地複製到另外一塊Survivor空間上,最後清理掉Eden和剛纔用過的Survivor空間。HotSpot虛擬機預設Eden和Survivor的大小比例是8:1。
如果另外一塊Survivor空間沒有足夠空間存放上一次新生代收集下來的存活對象時,這些對象將直接通過分配擔保機制進入老年代。
3.3.3 標記-整理演算法
複製收集演算法在對象存活率較高時就要進行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的記憶體中所有對象都100%存活的極端情況,所以在老年代一般不能直接選用這種演算法。
根據老年代的特點,有人提出了另外一種“標記-整理”(Mark-Compact)演算法,標記過程仍然與“標記-清除”演算法一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然後直接清理掉端邊界以外的記憶體,
3.3.4 分代收集演算法
商業虛擬機的垃圾收集都採用“分代收集”(Generational Collection)演算法。
一般是把Java堆分為新生代和老年代。
- 在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用複製演算法。
- 老年代中因為對象存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記—清理”或者“標記—整理”演算法來進行回收。