從誕生至今,20多年過去,Java至今仍是使用最為廣泛的語言。這仰賴於Java提供的各種技術和特性,讓開發人員能優雅的編寫高效的程式。今天我們就來說說Java的一項基本但非常重要的技術記憶體管理 瞭解C語言的同學都知道,在C語言中記憶體的開闢和釋放都是由我們自己來管理的,每一個new操作都要對於一個de ...
從誕生至今,20多年過去,Java至今仍是使用最為廣泛的語言。這仰賴於Java提供的各種技術和特性,讓開發人員能優雅的編寫高效的程式。今天我們就來說說Java的一項基本但非常重要的技術記憶體管理
瞭解C語言的同學都知道,在C語言中記憶體的開闢和釋放都是由我們自己來管理的,每一個new操作都要對於一個delete操作,否則就會參數記憶體泄漏和溢出的問題,導致非常槽糕的後果。但在Java開發過程中,則完全不需要擔心這個問題。因為jvm提供了自動記憶體管理的機制。記憶體管理的工作由jvm幫我們完成。這樣我們就不用為了釋放記憶體而頭疼了。
Jvm記憶體淺析
雖然jvm幫我們做了記憶體管理的工作,但是我們仍需要瞭解jvm到底做了什麼,下麵我們就一起去看一看
jvm啟動時進行一系列的工作,其中一項就是開闢一塊運行時記憶體。而這一塊記憶體中又分為了五大區域,分別用於不同的功能。
程式計數器
記錄程式運行的下一條指令的地址,這裡的“地址”可以是一個本地指針,也可以是在方法位元組碼中相對於該方法起始指令的偏移量。如果該線程正在執行一個本地方法,那麼此時程式計數器的值為”undefined”.在多線程環境下,每一個線程都有自己的程式計數器,在jvm調度線程時,會把當前的線程的程式計數器保存到快照,以便下次線程獲取執行時間時獲取
VM Stack
虛擬機棧是Java方法執行的記憶體模型,每個方法執行的時候,會在棧中創建一幀用於存儲局部變數表、操作數棧、動態鏈接、方法出口。方法開始調用時,會創建棧幀併入棧,方法執行結束時會出棧。每個線程都有自己的棧。
動態鏈接:
方法出口:
可以通過 -xxs 大小 來配置棧的大小,當嵌套調用使用不當,會導致方法不停的入棧,最終導致棧空間被占滿產生 StackOverflowError
本地方法棧
Heap
堆是用於存放對象實例的地方,幾乎所有對象實例在堆中分配。堆是線程共用的,這是多線程時同步機制的原因。
堆是GC管理的主要區域,GC在對堆進行回收前,首先要確定對象是否已死(不可能再被使用的對象)
判斷對象是否存活的演算法有兩種:引用計數演算法、可達性分析演算法
引用計數演算法是為每一個對象添加一個引用計數器,每當有一個引用指向它時,計數器就加一,任何時刻計數器為0的對象就不可能再被使用。這種演算法實現簡單,但是它很難解決對象迴圈引用的問題(何為迴圈引用見下方備註)
可達性分析演算法是Java語言正在使用的演算法。它的基本思想是通過一系統被稱為“GC Root”的對象為起點,從這個起點向下搜索,搜索走過的路徑稱為引用鏈,當一個對象不再任何引用鏈上時,則說明這個對象是不可能再被使用的。
在Java語言中,GC Root包括以下幾種對象:
- 虛擬機棧中引用的對象
- 本地方法棧中JNI引用的對象
- 方法區中類靜態成員變數引用的對象
- 方法區中常量引用的對象
可以看出分析對象是否存活,都與引用有關。在JDK1.2之後,Java對引用的概念進行了擴充,將引用分為 強引用(Strong Reference)、軟引用(Soft Reference)、弱引用(Weak Reference)、虛引用(Phantom Reference)
- 強引用
強引用即為原來意義上的引用,只要強引用存在,被引用的對象就不會被回收
- 軟引用
SoftReference類表示軟引用,對於被軟引用關聯的對象,在系統將要發生記憶體溢出時,會把這些對象列入回收範圍後,進行二次回收
- 弱引用
WeakReference類表示弱引用,對於被弱引用關聯的對象,只能生存到下一次垃圾回收發生之前
- 虛引用
PhantomReference類表示虛引用,虛引用不對關聯的對象的生存時間構成影響,也無法取得對象實例,它唯一的作用是在對象被GC回收是收到一條系統通知
堆得大小可以通過-Xmx和-Xms來控制。對於主流的Jvm,GC基本都採用分代收集的演算法。基於這個演算法, Java堆又分為新生代(Young Generation)和老年代(Old Generation),新生代又被進一步劃分為Eden和Survivor區,最後Survivor由FromSpace和ToSpace組成。新建的對象都是用新生代分配記憶體,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例。老生代用於存放新生代中經過多次垃圾回收(也即Minor GC)仍然存活的對象。
永生代(Permanent Space)為方法區
方法區
方法區也為所以線程所共用,用於存放已載入的類信息、靜態變數、常量和即時編譯器編譯後的代碼。-XX:MaxPermSize用於設置方法區大小
直接記憶體
直接記憶體不是虛擬機運行時數據區的一部分。通過Native函數庫直接分配的堆外記憶體,然後通過存儲在Java堆中的DirectByteBuffer對象作為這塊記憶體的引用進行操作
記憶體分配和回收策略
目前為止,jvm已經發展處三種比較成熟的垃圾收集演算法:1.標記-清除演算法;2.複製演算法;3.標記-整理演算法;4.分代收集演算法
1. 標記-清除演算法
這種垃圾回收一次回收分為兩個階段:標記、清除。首先標記所有需要回收的對象,在標記完成後回收所有被標記的對象。這種回收演算法會產生大量不連續的記憶體碎片,當要頻繁分配一個大對象時,jvm在新生代中找不到足夠大的連續的記憶體塊,會導致jvm頻繁進行記憶體回收(目前有機制,對大對象,直接分配到老年代中)
2. 複製演算法
這種演算法會將記憶體劃分為兩個相等的塊,每次只使用其中一塊。當這塊記憶體不夠使用時,就將還存活的對象複製到另一塊記憶體中,然後把這塊記憶體一次清理掉。這樣做的效率比較高,也避免了記憶體碎片。但是這樣記憶體的可使用空間減半,是個不小的損失。
3. 標記-整理演算法
這是標記-清除演算法的升級版。在完成標記階段後,不是直接對可回收對象進行清理,而是讓存活對象向著一端移動,然後清理掉邊界以外的記憶體
4. 分代收集演算法
當前商業虛擬機都採用這種演算法。首先根據對象存活周期的不同將記憶體分為幾塊即新生代、老年代,然後根據不同年代的特點,採用不同的收集演算法。在新生代中,每次垃圾收集時都有大量對象死去,只有少量存活,所以選擇了複製演算法。而老年代中因為對象存活率比較高,所以採用標記-整理演算法(或者標記-清除演算法)
GC的執行機制
由於對象進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。
Minor GC
一般情況下,當新對象生成,並且在Eden申請空間失敗時,就會觸發Minor GC,對Eden區域進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的演算法,使Eden去能儘快空閑出來。
Full GC
對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,所以比Minor GC要慢,因此應該儘可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於FullGC的調節。有如下原因可能導致Full GC:
1.年老代(Tenured)被寫滿
2.持久代(Perm)被寫滿
3.System.gc()被顯示調用
4.上一次GC之後Heap的各域分配策略動態變化
Java常見的記憶體泄漏
- 資料庫連接,網路連接,IO連接等沒有顯示調用close關閉,會導致記憶體泄露
- 監聽器的使用,在釋放對象的同時沒有相應刪除監聽器的時候也可能導致記憶體泄露