1 雲原生時代Java語言的困境 經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。 雲原生時代,J ...
1 雲原生時代Java語言的困境
經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。
雲原生時代,Java語言一次編譯到處運行的優勢不復存在,理論上使用容器化技術,所有語言都能部署上雲,而無法脫離JVM的Java應用往往要面對JDK記憶體占用比應用本身還大的窘境;Java動態載入、卸載的特性也使得構建的應用鏡像中有一半以上的無用代碼和依賴這些都使得Java應用占用記憶體相當多。而啟動時間長,性能達到峰值的時間長使得在Serverless等場景下無法與Go、Node.js等快速語言競爭。
2 GraalVM
面對雲原生時代Java的不適,GraalVM或許是最好的解藥。GraalVM是Oracle實驗室推出的基於Java開發的開源高性能多語言運行時平臺,它既可以在傳統的 OpenJDK 上運行,也可以通過 AOT(Ahead-Of-Time)編譯成可執行文件單獨運行,甚至可以集成至資料庫中運行。除此之外,它還移除了編程語言之間的邊界,並且支持通過即時編譯技術,將混雜了不同的編程語言的代碼編譯到同一段二進位碼之中,從而實現不同語言之間的無縫切換。
本文主要簡單從三個方面介紹GraalVM可以為我們帶來的改變:
1)基於Java的Graal Compiler的出現對學習和研究虛擬機代碼編譯技術有著不可估量的價值,相比C++編寫的複雜無比的服務端編譯器,不管是對編譯器的優化還是學習的成本都大大的降低。
2)靜態編譯框架Substrate VM框架,為Java在雲原生時代提供了與其他語言競爭的可能,大大的減少了Java應用占用記憶體,並且可以加快啟動速度幾十倍。
3)以Truffle和Sulong為代表的中間語言解釋器,開發者可以使用Truffle提供的API快速用Java實現一種語言的解釋器,從而實現了在JVM平臺上運行其他語言的效果,為Java世界帶來了更多更有想象力的可能性。
3 GraalVM整體結構
graal
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── SECURITY.md
├── THIRD_PARTY_LICENSE.txt
├── bench-common.libsonnet
├── ci-resources.libsonnet
├── ci.hocon
├── ci.jsonnet
├── ci_includes
├── common-utils.libsonnet
├── common.hocon
├── common.json
├── common.jsonnet
├── compiler
├── docs
├── espresso
├── graal-common.json
├── java-benchmarks
├── regex
├── repo-configuration.libsonnet
├── sdk
├── substratevm
├── sulong
├── tools
├── truffle
├── vm
└── wasm
3.1 Compiler
Compiler子項目全稱GraalVM編譯器,是用Java語言編寫的Java編譯器。高編譯效率、高輸出質量、同時支持提前編譯(AOT)和即時編譯(JIT)、同時支持應用於包括HotSpot在內的不同虛擬機的編譯器。
與C2採用一樣的中間表示形式(Sea of Nodes IR),後端優化上直接繼承了大量來自於HotSpot的服務端編譯器的高質量優化技術,是現在高校、研究院和企業編譯研究實踐的主要平臺。
Graal Compiler是GraalVM與HotSpotVM(從JDK10起)共同擁有的服務端即時編譯器,是C2編譯器未來的替代者。為了讓 Java 虛擬機與編譯器解耦,ORACLE引入了Java-Level JVM Compiler Interface(JVMCI)Jep 243 :把編譯器從虛擬機中抽離出來,並且可以通過介面與虛擬機交流(https://openjdk.java.net/jeps/243)
具體來說,即時編譯器與 Java 虛擬機的交互可以分為如下三個方面。
- 響應編譯請求;
- 獲取編譯所需的元數據(如類、方法、欄位)和反映程式執行狀態的 profile;
- 將生成的二進位碼部署至代碼緩存(code cache)里。
oracle提供的編譯時間差異示例
3.2 Substrate VM
Substrate VM提供了將Java程式靜態編譯為本地代碼的編譯工具鏈,包括了編譯框架、靜態分析工具、C++支持框架及運行時支持等。在程式運行前便將位元組碼轉換為機器碼
優點:
- 從指定的編譯入口開始靜態可達性分析,有效的控制了編譯範圍,解決了代碼膨脹的問題;
- 實現了多種運行時優化例如:傳統的java類是在第一次被用到時初始化的,之後每次調用時還要再檢查是否初始化過,GraalVM將其優化為在編譯時初始化;
- 無需在運行過程中耗費CPU資源來進行即時編譯,而程式也能在啟動一開始就達到理想的性能;
缺點:
- 靜態分析是資源密集型計算,需要消耗大量CPU、記憶體和時間;
- 靜態分析對反射、JNI、動態代理的分析能力非常有限,目前GraalVM只能通過額外配置的方式加以解決;
- Java序列化也有多項違反封閉性假設的動態特性:反射,JNI,動態類載入,目前GraalVM也需要通過額外配置解決,且不能處理所有序列化,例如Lambda對象的序列化,而且性能是JDK的一半;
啟動時長對比
占用記憶體對比
3.3 Truffle
我們知道一般編譯器分為前端和後端,前端負責詞法分析、語法分析、類型檢查和中間代碼生成,後端負責編譯優化和目標代碼生成。一種比較取巧的做法是將新語言編譯成某種已知語言,如Scala、Kotlin可以編譯成Java位元組碼,這樣就可以直接享用JVM的JIT、GC等各項優化,這種做法都是針對的編譯型語言。與之相對的,如JavaScript、Ruby、R、Python等解釋型語言,它們依賴於解釋執行器進行解析並執行,為了讓這類解釋型語言能夠更高效的執行,開發人員通常需要開發虛擬機,並實現垃圾回收,即時編譯等組件,讓該語言在虛擬機中執行,如Google的V8引擎。如果能讓這些語言也可以在JVM上運行並復用JVM的各種優化方案,將會減少許多重覆造輪子的消耗。這也是Truffle項目的目標。
Truffle是一個用Java編寫的解釋器實現框架。它提供瞭解釋器的開發框架介面,可以幫助開發人員用Java為自己感興趣的語言快速開發處語言解釋器,目前已經實現並維護了JavaScript、Ruby、R、Python等語言。
只需基於Truffle實現相關語言的詞法分析器、語法分析器及針對語法分析所生成的抽象語法樹(AST)的解釋執行器,便可以運行在任何Java虛擬機上,享用JVM提供的各項運行時優化。
GraalVM多語言運行時性能加速比
3.3.1 Partial Evaluation
Truffle的實現原理基於Partial Evaluation這一概念:假設程式prog為將輸入轉為輸出
其中Istatic為靜態數據,在編譯時已知常量,Idynamic為編譯時未知數據,則可以將程式等價為:
新程式prog為prog的特化,他應該會比原程式更高效的執行,這個從prog轉換到prog的過程便稱為Partial Evaluation。我們可以將Truffle預壓的解釋執行器當成prog,將某段由Truffle語言寫的程式當做Istatic,並通過Partial Evaluation將prog轉換到prog*。
下麵引用一個Oracle官方的例子來講解,以下程式實現了讀取參數以及參數相加的操作,需要實現讀取三個參數相加:
這段程式解析生成的AST為
sample = new Add(new Add(new Arg(0), new Arg(1)), new Arg(2));
經過Partial Evaluator 的不斷進行方法內聯最終會變成下述代碼:
3.3.2 節點重寫
節點重寫是Truffle的另一項關鍵優化。
在動態語言中許多變數的類型是在運行時才能確定的,以“加法”舉例,符號+即可以表示整型相加也可以表示浮點型相加。Truffle的語言解釋器會收集每個AST節點所代表的操作類型(profile),並且在編譯時做出針對所收集到的profile進行優化,如:若收集到的profile顯示這是一個整型加法操作,Truffle會在即時編譯時將AST進行變形,將“+”視為整型加法。
當然,這種優化也會有錯誤的時候,比如上述加法操作既有可能是整數加法也可能是字元串加法,此時若AST樹已變形,那麼我們只好丟棄編譯後的機器代碼,回退到AST解釋執行。這種基於類型 profile 的優化,背後的核心就是基於假設的投機性優化,以及在假設失敗時的去優化。
在即時編譯過後,如果運行過程中發現 AST 節點的實際類型和所假設的類型不同,Truffle 會主動調用 Graal 編譯器提供的去優化 API,返回至解釋執行 AST 節點的狀態,並且重新收集 AST 節點的類型信息。之後,Truffle 會再次利用 Graal 編譯器進行新一輪的即時編譯。
據統計,在 JavaScript 方法和 Ruby 方法中,80% 會在 5 次方法調用後穩定下來,90% 會在 7 次調用後穩定下來,99%會在 19 次方法調用之後穩定下來。
3.4 Sulong
Sulong子項目是GraalVM為LLVM的中間語言bitcode提供的高新更運行時工具,是基於Truffle框架實現的bitcode解釋器。Sulong為所有可以編譯到LLVM bitcode的語言(如C,C++等)提供了在JVM中執行的解決方案。
4 參考
- 林子熠 《GraalVM與靜態編譯》;
- 周志明《深入理解Java虛擬機》;
- Java Developer’s Introduction to GraalVM:-鄭雨迪
- Truffle/Graal:From Interpreters toOptimizing Compilers via Partial Evaluation:-Carnegie Mellon University
作者:王子豪