對象的創建 虛擬機遇到一條new指令時,首先檢查指令的參數能否在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已經被載入、解析和初始化過。如果沒有,必須先執行相應的類載入過程。 接下來虛擬機為新生對象分配記憶體。對象所需要的記憶體在類載入完成後可以被完全確定,所以只需要把一塊確定大小的 ...
對象的創建
虛擬機遇到一條new指令時,首先檢查指令的參數能否在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已經被載入、解析和初始化過。如果沒有,必須先執行相應的類載入過程。
接下來虛擬機為新生對象分配記憶體。對象所需要的記憶體在類載入完成後可以被完全確定,所以只需要把一塊確定大小的記憶體區域從堆中劃分出來給這個對象即可:
-
如果堆的記憶體是規整的,所有使用的記憶體在一邊,未使用的記憶體在另一邊,中間是一個作為分界點的指針,那分配空間只需要移動作為分界點的指針(移動距離等於該對象需要的空間)。這種方法叫“指針碰撞”(Bump the Pointer)
-
如果堆的記憶體是不規整的,那麼虛擬機需要維護一個列表,記錄那些記憶體塊是可用的,在分配的時候劃分一個足夠大的記憶體塊給該對象,並且更新列表的記錄。這種方法叫”空閑列表“(Free List)
-
Java堆記憶體是否規整取決於所採用的垃圾收集器是否帶有壓縮整理的功能。
由於對象分配是非常頻繁的操作,所以必須考慮線程安全問題:
-
方法一是同步分配空間的動作,通過採用CAS+失敗重試保證更新操作的原子性。
-
方法二是給每個線程都分配本地線程分配緩衝TLAB,哪個線程要分配記憶體,就在那個線程的TLAB上分配。當線程的TLAB用完,重新分配新的TLAB時,才需要同步鎖定。
分配記憶體後,虛擬機設置對象的一些必要信息,這些信息存在在對象的對象頭中。一般來說,執行new指令後,會接著執行<init>方法,將對象初始化。這樣一個真正可用的對象才算完全產生出來。
編譯器為每個類生成至少一個實例初始化方法,即<init>()方法。此方法與源程式里的每個構造方法對應。如果類沒有聲明構造方法,則生成一個預設構造方法,該方法僅調用父類的預設構造方法,同時生成與該預設構造方法對應的<init>()方法。
<init>()方法內容大概為:
調用另一個<init>()方法(本類的另外一個<init>()方法或父類的<init>()方法);
初始化實例變數;
與其對應的構造方法內的位元組碼
對象的記憶體佈局
對象在記憶體中的佈局可以分為3塊區域:對象頭(header),實例數據(Instance Data)和對齊填充(Padding)。
對象頭包括兩部分信息:
-
第一部分用於存儲對象自身的運行時數據。如哈希碼,GC分代年齡,鎖狀態標誌,線程持有的鎖,偏向線程id,偏向時間戳等。考慮到虛擬機的空間效率,此部分在32位和64位虛擬機中只占32位或者64位的大小。
-
第二部分是類型指針。即對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例。(並不是所有的虛擬機實現都保留類型指針,查找對象 的元數據信息不一定要通過對象本身)
如果該對象是數組,那麼對象頭還會保留一塊數據,用於記錄數組長度。
接下來的實例數據是對象真正存儲的有效信息,也是在代碼中定義的各種類型的欄位內容。這部分的存儲順序會受到虛擬機分配策略參數和欄位在Java源碼中定義順序的影響。Hotspot虛擬機預設策略是longs/doubles,ints,shorts/chars,bytes/booleans,oops(Ordinary Object Pointers),相同寬度的欄位總是分配到一起。在這個去前提下,父類中定義的變數會出現在子類之前。
對齊填充不是必須的,也沒有特別的意義,僅僅起到占位符的作用。HotSpot的自動記憶體管理系統要求對象起始地址必須是8位元組的整數倍。
對象的訪問定位
Java程式通過棧上的reference數據來操作堆上的具體對象。由於reference類型在Java虛擬機中的規範中只規定了一個指向對象的引用,並沒有定義這個引用應該通過何種方式去定位、訪問堆中的對象的具體位置,所以對象訪問方式也是取決於虛擬機的實現而定的。目前主流的訪問方式有試用句柄和直接指針兩種:
-
句柄訪問。Java堆劃分出一塊記憶體作為句柄池,reference中存儲的就是對象的句柄地址,句柄中包含了對象實例數據與類型數據各自的具體地址信息
-
直接指針訪問。Java堆對象的佈局中必要考慮如何防止訪問類型數據的相關信息,而reference中存儲的直接就是對象地址。
直接指針訪問的最大好處是速度更快,節省了一次指針定位的時間開銷。