虛擬機是如何調用方法的內容已經講解完畢,從本節開始,我們來探討虛擬機是如何執行方法中的位元組碼指令的。上文中提到過,許多Java虛擬機的執行引擎在執行Java代碼的時候都有解釋執行(通過解釋器執行)和編譯執行(通過即時編譯器產生本地代碼執行)兩種選擇,在本章中,我們先來探討一下在解釋執行時,虛擬機執行 ...
虛擬機是如何調用方法的內容已經講解完畢,從本節開始,我們來探討虛擬機是如何執行方法中的位元組碼指令的。上文中提到過,許多Java虛擬機的執行引擎在執行Java代碼的時候都有解釋執行(通過解釋器執行)和編譯執行(通過即時編譯器產生本地代碼執行)兩種選擇,在本章中,我們先來探討一下在解釋執行時,虛擬機執行引擎是如何工作的。
1、解釋執行
如今,基於物理機、Java虛擬機,或者非Java的其他高級語言虛擬機(HLLVM)的語言,大多都會遵循這種基於現代經典編譯原理的思路,在執行前先對程式源碼進行詞法分析和語法分析處理,把源碼轉化為抽象語法樹(Abstract Syntax Tree,AST)。對於一門具體語言的實現來說,詞法分析、語法分析以至後面的優化器和目標代碼生成器都可以選擇獨立於執行引擎,形成一個完整意義的編譯器去實現,這類代表是C/C++語言。也可以選擇把其中一部分步驟(如生成抽象語法樹之前的步驟)實現為一個半獨立的編譯器,這類代表是Java語言。又或者把這些步驟和執行引擎全部集中封裝在一個封閉的黑匣子之中,如大多數的JavaScript執行器。
Java語言中,Javac編譯器完成了程式代碼經過詞法分析、語法分析到抽象語法樹,再遍歷語法樹生成線性的位元組碼指令流的過程。因為這一部分動作是在Java虛擬機之外進行的,而解釋器在虛擬機的內部,所以Java程式的編譯就是半獨立的實現。
2、 基於棧的指令集與基於寄存器的指令集
Java編譯器輸出的指令流,基本上是一種基於棧的指令集架構(Instruction Set Architecture,ISA),指令流中的指令大部分都是零地址指令,它們依賴操作數棧進行工作。與之相對的另外一套常用的指令集架構是基於寄存器的指令集,最典型的就是x86的二地址指令集,說得通俗一些,就是現在我們主流PC機中直接支持的指令集架構,這些指令依賴寄存器進行工作。
既然兩套指令集會同時並存和發展,那肯定是各有優勢的,如果有一套指令集全面優於另外一套的話,就不會存在選擇的問題了。
基於棧的指令集主要的優點就是可移植,寄存器由硬體直接提供,程式直接依賴這些硬體寄存器則不可避免地要受到硬體的約束。例如,現在32位80x86體系的處理器中提供了8個32位的寄存器,而ARM體系的CPU(在當前的手機、PDA中相當流行的一種處理器)則提供了16個32位的通用寄存器。如果使用棧架構的指令集,用戶程式不會直接使用這些寄存器,就可以由虛擬機實現來自行決定把一些訪問最頻繁的數據(程式計數器、棧頂緩存等)放到寄存器中以獲取儘量好的性能,這樣實現起來也更加簡單一些。
棧架構的指令集還有一些其他的優點,如代碼相對更加緊湊(位元組碼中每個位元組就對應一條指令,而多地址指令集中還需要存放參數)、編譯器實現更加簡單(不需要考慮空間分配的問題,所需空間都在棧上操作)等。
棧架構指令集的主要缺點是執行速度相對來說會稍慢一些。所有主流物理機的指令集都是寄存器架構也從側面印證了這一點。
雖然棧架構指令集的代碼非常緊湊,但是完成相同功能所需的指令數量一般會比寄存器架構多,因為出棧、入棧操作本身就產生了相當多的指令數量。更重要的是,棧實現在記憶體之中,頻繁的棧訪問也就意味著頻繁的記憶體訪問,相對於處理器來說,記憶體始終是執行速度的瓶頸。儘管虛擬機可以採取棧頂緩存的手段,把最常用的操作映射到寄存器中避免直接記憶體訪問,但這也只能是優化措施而不是解決本質問題的方法。由於指令數量和記憶體訪問的原因,所以導致了棧架構指令集的執行速度會相對較慢。
3 、基於棧的解釋器執行過程
略