本文基於 JDK1.8 闡述分析 運行過程 我們都知道 Java 源文件通過編譯器編譯後,能產生相應的 .Class 文件,也就是位元組碼文件。而位元組碼文件通過 Java 虛擬機中的解釋器,編譯成特定機器上的機器碼。 跨平臺的特性 Java 能跨平臺的原因是因為:不同的平臺有不同的 JVM 版本,一個 ...
本文基於 JDK1.8 闡述分析
運行過程
我們都知道 Java 源文件通過編譯器編譯後,能產生相應的 .Class 文件,也就是位元組碼文件。而位元組碼文件通過 Java 虛擬機中的解釋器,編譯成特定機器上的機器碼。
跨平臺的特性
Java 能跨平臺的原因是因為:不同的平臺有不同的 JVM 版本,一個 Java 源文件被編譯成位元組碼文件,被不同平臺的 JVM 翻譯成特定平臺下的機器碼從而運行。
Java 虛擬機組成
Java 虛擬機由三個子系統構成,分別是類載入子系統、JVM 運行時數據區和執行引擎,本文的重點是在 JVM 運行時數據區。
類載入子系統將硬碟上的位元組碼文件載入進記憶體,JVM 運行記憶體有一套自己的結構劃分如圖所示,最終程式要運行,需要操作系統分配相應的時間調度,由執行引擎去執行,才能得到最終結果。
線程共用數據:允許被所有線程共用訪問的一塊記憶體區域。
線程私有數據:本線程私有的一塊記憶體區域
虛擬機棧(JVM Stacks)
-
Java 虛擬機棧是線程私有的,它的生命周期與線程相同,線程啟動而產生,線程結束而消亡。
-
Java 虛擬機棧是描述 Java 方法執行的記憶體模型,用於存儲棧幀。
-
如果線程請求的棧深度大於虛擬機所允許的深度,將拋出 StackOverflowError 異常。
-
虛擬機棧可以動態擴展,如果擴展時無法申請到足夠的記憶體,就會拋出 OutOfMemoryError 異常。
-
除了 native 方法,幾乎所有的 Java 方法都是通虛擬機棧來實現方法的調用和執行(需要程式計數器、堆、方法區的配合)。
-
棧幀(Stack Frame)
- 每個方法執行的同時會創建一個棧幀,它是虛擬機棧的基本元素。
- 一個方法從調用到執行完成的過程,就對應著一個棧幀在虛擬機棧中入棧到出棧的過程。
- 在活動線程中,只有位於棧頂的棧幀才是有效的,稱為當前棧幀,與這個棧幀相關聯的方法稱為當前方法。執行引擎運行的所有位元組碼指令都只針對當前棧幀進行操作。
- 棧幀隨著方法調用而創建,隨著方法結束而銷毀。
- 每一個棧幀包含的內容有局部變數表、操作數棧、動態鏈接、方法返回地址和一些額外的附加信息。
-
局部變數表(Local Variable Table)
- 一組變數值存儲空間,用於存放方法參數和方法內定義的局部變數。
- 該方法所需要分配的局部變數表的最大容量在將 Java 編譯為 Class 文件時已經確定。
- 一個局部變數表保存的是編譯期可知的各種基本數據類型、對象引用和 returnAddress 類型(它指向了一條位元組碼指令的地址)。
- 局部變數表的容量以變數槽為最小單位,每個變數槽可以存儲32位長度的記憶體空間。對於64位長度的數據類型(long,double),虛擬機會以高位對齊方式為其分配兩個連續的變數糙空間。
- 局部變數表所需的記憶體空間在編譯期間就能完成分配,在運行期間不會改變其大小。
- 虛擬機通過索引定位的方法查找相應的局部變數
-
操作數棧(Operand Stack)
- 虛擬機棧中的一個用於計算的臨時數據存儲區。
- 隨著方法執行和位元組碼指令的執行,會從局部變數表或對象實例的欄位中複製常量或變數寫入到操作數棧,再隨著計算的進行將棧中元素出棧到局部變數表或者返回給方法調用者,也就是出棧/入棧操作。
-
動態鏈接(Dynamic Linking)
- 在一個class文件中,一個方法要調用其他方法,需要將這些方法的符號引用轉化為其在記憶體地址中的直接引用,而符號引用存在於運行時常量池。
- 每個棧幀都包含一個指向運行時常量池中該棧所屬方法的符號引用。
- 這些符號引用一部分會在類載入階段或者第一次使用時就直接轉化為直接引用,這類轉化稱為靜態解析。另一部分將在每次運行期間轉化為直接引用,這類轉化稱為動態連接。
-
方法返回
- 一個方法開始執行後,只有兩種退出方式:正常完成出口和異常完成出口
- 正常完成出口指方法正常完成並退出,根據當前方法返回的位元組碼指令,這時有可能會有返回值傳遞給方法調用者(調用它的方法),或者無返回值。
- 異常完成出口指方法執行過程中遇到異常,並且這個異常在方法體內部沒有得到處理,導致方法退出。
- 無論採用何種退出方式,在方法退出後,都需要返回到方法被調用的位置,方法返回時可能需要在棧幀中保存一些信息。
- 一般來說,方法正常退出時,調用者的程式計數器的值可以作為返回地址,棧幀中會保存這個計數器值。而方法異常退出時,返回地址要通過異常處理器表來確定,棧幀中一般不保存這部分信息。
-
附加信息
- 虛擬機規範允許具體的虛擬機實現增加一些規範中沒有描述的信息到棧幀之中,例如和調試相關的信息,這部分信息完全取決於不同的虛擬機實現。
- 在實際開發中,一般會把動態連接,方法返回地址與其他附加信息一起歸為一類,稱為棧幀信息。
程式計數器(Program Counter Register)
程式計數器是一塊較小的記憶體空間,它可以看作是當前線程所執行的位元組碼的行號指示器。在虛擬機的概念模型里,位元組碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令。分支、迴圈、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
-
程式計數器是線程私有的
JVM 的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現,在同一時刻一個處理器內核只會執行一條線程,處理器切換線程時並不會記錄上一個線程執行到哪個位置,所以為了線程切換後依然能恢復到原位,每條線程都需要有各自獨立的程式計數器。
-
JVM 規範中唯一沒有規定 OutOfMemoryError 情況的區域
程式計數器存儲的是位元組碼文件的行號,而這個範圍是可知曉的,在一開始分配記憶體時就可以分配一個絕對不會溢出的記憶體。
-
執行 Native 方法時計數器值為空
當執行 Java 方法時,程式計數器存放 Java 位元組碼的地址。實現上可能有兩種形式,一種是相對該方法位元組碼開始處的偏移量,叫做 bytecode index(簡稱 bci)。另一種是該 Java 位元組碼指令在記憶體的地址,叫做 bytecode pointer(簡稱 bcp)。
Native 方法大多通過 C 實現,它的方法體不是由 Java 位元組碼構成,無法應用上述 Java 位元組碼地址的概念,也就不需要存儲位元組碼文件的行號。
-
Native 方法的實際執行
Java 線程總是需要以某種形式映射到 OS 線程上,HotSpot VM 目前在大多數平臺上都使用 1:1 模型(原生線程模型),也就是每個 Java 線程直接映射到一個 OS 線程上執行。此時 native 方法由原生平臺直接執行。
本地方法棧(Native Method Stacks)
本地方法棧為虛擬機使用到的 Native 方法服務。Native 方法是 Java 通過 JNI 直接調用本地 C/C++ 庫,可以認為是 Native 方法相當於 C/C++ 暴露給 Java 的一個介面,Java 通過調用這個介面從而調用 C/C++ 方法。與虛擬機棧一樣,本地方法棧區域也會拋出 StackOverflowError 和 OutOfMemoryError 異常。
-
Java 程式調用本地方法
不同於虛擬機棧的入/出棧,當線程調用 native 方法時,虛擬機只是簡單地動態連接並直接調用指定的 native 方法。
-
本地方法介面回調 JVM 中的 Java 方法
如果某個虛擬機實現的本地方法介面是使用 C 連接模型的話,那個他的本地方法棧就是 C 棧,當一個 C 函數調用另一個 C 函數時,它的棧操作是確定的。如果本地方法介面需要回調JVM 中的 Java 方法,該線程會保存本地方法棧的狀態併進入到另一個Java棧。
-
不同虛擬機的不同實現
虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。常用的 HotSpot 虛擬機選擇合併了虛擬機棧和本地方法棧。
堆(Heap)
堆是 JVM 所管理的最大的一塊記憶體空間,主要用於存放各種類的實例對象。堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可,就像我們的磁碟空間一樣。
-
分代概念
- JVM 中堆空間由新生代和老年代兩個區組成
- 新生代可以劃分為三個區,Eden 區,兩個 Survivor 區
- Eden = 8/10 的新生代空間大小,from = to = 1/10 的新生代空間大小。
- JVM 每次只會使用 Eden 和其中的一塊 Survivor 區域來為對象服務,所以無論什麼時候,總是有一塊 Survivor 區域是空閑著的。
-
常用參數配置
參數 說明 -Xms 堆記憶體初始大小 -Xmx 堆記憶體最大允許大小 -Xss 每個線程的 Stack 大小 -XX:NewSize(-Xns) 新生代初始大小 -XX:MaxNewSize(-Xmn) 新生代最大允許大小 -XX:NewRatio 設置新生代與老年代比值 -XX:SurvivorRatio 設置 Survivor 與 Eden 比值 -XX:PermSize 設置持久代初始記憶體大小(JDK8 以前) -XX:MaxPermSize 設置持久代最大記憶體(JDK8 以前) -XX:MetaspaceSize 設置元空間初始記憶體大小(JDK8 以後) -XX:MaxMetaspaceSize 設置元空間最大記憶體(JDK8 以後) -
堆 GC
在堆中分配的記憶體,由 JVM 自動垃圾回收器來管理。關於 GC 詳情,之後再補充。
方法區(Method Area)
方法區是一種規範,不同的虛擬機的實現也不一樣。從 JDK 1.8 開始,元空間(Metaspace)取代了永久代(PermGen)成為 HotSpot VM 對方法區的實現。方法區存儲載入進來的每一個類的結構信息,可以看做是將類(Class)的模板信息,保存在方法區里
-
元空間屬於本地記憶體
JDK8 以前,永久代是堆的一部分,和新生代、老年代的地址是連續的。JDK8 以後,元空間屬於本地記憶體,不再屬於堆的一部分,它還有一個別名叫非堆(Non-Heap),所以元空間不存在 OOM 記憶體溢出的情況。
-
方法區是線程共用的
當多個線程用到同一個類,而這個類還未被載入,則應該只有一個線程去載入類,其他線程等待。