初步探索GraalVM——雲原生時代JVM黑科技

来源:https://www.cnblogs.com/Jcloud/archive/2022/11/17/16898539.html
-Advertisement-
Play Games

1 雲原生時代Java語言的困境 經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。 雲原生時代,J ...


1 雲原生時代Java語言的困境

經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。

雲原生時代,Java語言一次編譯到處運行的優勢不復存在,理論上使用容器化技術,所有語言都能部署上雲,而無法脫離JVM的Java應用往往要面對JDK記憶體占用比應用本身還大的窘境;Java動態載入、卸載的特性也使得構建的應用鏡像中有一半以上的無用代碼和依賴這些都使得Java應用占用記憶體相當多。而啟動時間長,性能達到峰值的時間長使得在Serverless等場景下無法與Go、Node.js等快速語言競爭。

Java應用程式的運行生命周期示意圖

2 GraalVM

面對雲原生時代Java的不適,GraalVM或許是最好的解藥。GraalVM是Oracle實驗室推出的基於Java開發的開源高性能多語言運行時平臺,它既可以在傳統的 OpenJDK 上運行,也可以通過 AOT(Ahead-Of-Time)編譯成可執行文件單獨運行,甚至可以集成至資料庫中運行。除此之外,它還移除了編程語言之間的邊界,並且支持通過即時編譯技術,將混雜了不同的編程語言的代碼編譯到同一段二進位碼之中,從而實現不同語言之間的無縫切換。

 

本文主要簡單從三個方面介紹GraalVM可以為我們帶來的改變:

1)基於Java的Graal Compiler的出現對學習和研究虛擬機代碼編譯技術有著不可估量的價值,相比C++編寫的複雜無比的服務端編譯器,不管是對編譯器的優化還是學習的成本都大大的降低。
2)靜態編譯框架Substrate VM框架,為Java在雲原生時代提供了與其他語言競爭的可能,大大的減少了Java應用占用記憶體,並且可以加快啟動速度幾十倍。

 

3)以Truffle和Sulong為代表的中間語言解釋器,開發者可以使用Truffle提供的API快速用Java實現一種語言的解釋器,從而實現了在JVM平臺上運行其他語言的效果,為Java世界帶來了更多更有想象力的可能性。

GraalVM多語言支持

3 GraalVM整體結構

graal
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── SECURITY.md
├── THIRD_PARTY_LICENSE.txt
├── bench-common.libsonnet
├── ci-resources.libsonnet
├── ci.hocon
├── ci.jsonnet
├── ci_includes
├── common-utils.libsonnet
├── common.hocon
├── common.json
├── common.jsonnet
├── compiler
├── docs
├── espresso
├── graal-common.json
├── java-benchmarks
├── regex
├── repo-configuration.libsonnet
├── sdk
├── substratevm
├── sulong
├── tools
├── truffle
├── vm
└── wasm

3.1 Compiler

Compiler子項目全稱GraalVM編譯器,是用Java語言編寫的Java編譯器。高編譯效率、高輸出質量、同時支持提前編譯(AOT)和即時編譯(JIT)、同時支持應用於包括HotSpot在內的不同虛擬機的編譯器。

與C2採用一樣的中間表示形式(Sea of Nodes IR),後端優化上直接繼承了大量來自於HotSpot的服務端編譯器的高質量優化技術,是現在高校、研究院和企業編譯研究實踐的主要平臺。

Graal Compiler是GraalVM與HotSpotVM(從JDK10起)共同擁有的服務端即時編譯器,是C2編譯器未來的替代者。為了讓 Java 虛擬機與編譯器解耦,ORACLE引入了Java-Level JVM Compiler Interface(JVMCI)Jep 243 :把編譯器從虛擬機中抽離出來,並且可以通過介面與虛擬機交流(https://openjdk.java.net/jeps/243)

 

具體來說,即時編譯器與 Java 虛擬機的交互可以分為如下三個方面。

  1. 響應編譯請求;
  2. 獲取編譯所需的元數據(如類、方法、欄位)和反映程式執行狀態的 profile;
  3. 將生成的二進位碼部署至代碼緩存(code cache)里。

 

 

 


oracle提供的編譯時間差異示例

3.2 Substrate VM

Substrate VM提供了將Java程式靜態編譯為本地代碼的編譯工具鏈,包括了編譯框架、靜態分析工具、C++支持框架及運行時支持等。在程式運行前便將位元組碼轉換為機器碼

優點:

  1. 從指定的編譯入口開始靜態可達性分析,有效的控制了編譯範圍,解決了代碼膨脹的問題;
  2. 實現了多種運行時優化例如:傳統的java類是在第一次被用到時初始化的,之後每次調用時還要再檢查是否初始化過,GraalVM將其優化為在編譯時初始化;
  3. 無需在運行過程中耗費CPU資源來進行即時編譯,而程式也能在啟動一開始就達到理想的性能;

缺點:

  1. 靜態分析是資源密集型計算,需要消耗大量CPU、記憶體和時間;
  2. 靜態分析對反射、JNI、動態代理的分析能力非常有限,目前GraalVM只能通過額外配置的方式加以解決;
  3. Java序列化也有多項違反封閉性假設的動態特性:反射,JNI,動態類載入,目前GraalVM也需要通過額外配置解決,且不能處理所有序列化,例如Lambda對象的序列化,而且性能是JDK的一半;

 

 


啟動時長對比

 


占用記憶體對比

3.3 Truffle

我們知道一般編譯器分為前端和後端,前端負責詞法分析、語法分析、類型檢查和中間代碼生成,後端負責編譯優化和目標代碼生成。一種比較取巧的做法是將新語言編譯成某種已知語言,如Scala、Kotlin可以編譯成Java位元組碼,這樣就可以直接享用JVM的JIT、GC等各項優化,這種做法都是針對的編譯型語言。與之相對的,如JavaScript、Ruby、R、Python等解釋型語言,它們依賴於解釋執行器進行解析並執行,為了讓這類解釋型語言能夠更高效的執行,開發人員通常需要開發虛擬機,並實現垃圾回收,即時編譯等組件,讓該語言在虛擬機中執行,如Google的V8引擎。如果能讓這些語言也可以在JVM上運行並復用JVM的各種優化方案,將會減少許多重覆造輪子的消耗。這也是Truffle項目的目標。

Truffle是一個用Java編寫的解釋器實現框架。它提供瞭解釋器的開發框架介面,可以幫助開發人員用Java為自己感興趣的語言快速開發處語言解釋器,目前已經實現並維護了JavaScript、Ruby、R、Python等語言。

只需基於Truffle實現相關語言的詞法分析器、語法分析器及針對語法分析所生成的抽象語法樹(AST)的解釋執行器,便可以運行在任何Java虛擬機上,享用JVM提供的各項運行時優化。

 


GraalVM多語言運行時性能加速比

3.3.1 Partial Evaluation

Truffle的實現原理基於Partial Evaluation這一概念:假設程式prog為將輸入轉為輸出

 

其中Istatic為靜態數據,在編譯時已知常量,Idynamic為編譯時未知數據,則可以將程式等價為:

 

新程式prog為prog的特化,他應該會比原程式更高效的執行,這個從prog轉換到prog的過程便稱為Partial Evaluation。我們可以將Truffle預壓的解釋執行器當成prog,將某段由Truffle語言寫的程式當做Istatic,並通過Partial Evaluation將prog轉換到prog*。

下麵引用一個Oracle官方的例子來講解,以下程式實現了讀取參數以及參數相加的操作,需要實現讀取三個參數相加:

 

這段程式解析生成的AST為

sample = new Add(new Add(new Arg(0), new Arg(1)), new Arg(2));

 

經過Partial Evaluator 的不斷進行方法內聯最終會變成下述代碼:

 

3.3.2 節點重寫

節點重寫是Truffle的另一項關鍵優化。

在動態語言中許多變數的類型是在運行時才能確定的,以“加法”舉例,符號+即可以表示整型相加也可以表示浮點型相加。Truffle的語言解釋器會收集每個AST節點所代表的操作類型(profile),並且在編譯時做出針對所收集到的profile進行優化,如:若收集到的profile顯示這是一個整型加法操作,Truffle會在即時編譯時將AST進行變形,將“+”視為整型加法。

當然,這種優化也會有錯誤的時候,比如上述加法操作既有可能是整數加法也可能是字元串加法,此時若AST樹已變形,那麼我們只好丟棄編譯後的機器代碼,回退到AST解釋執行。這種基於類型 profile 的優化,背後的核心就是基於假設的投機性優化,以及在假設失敗時的去優化。

 

在即時編譯過後,如果運行過程中發現 AST 節點的實際類型和所假設的類型不同,Truffle 會主動調用 Graal 編譯器提供的去優化 API,返回至解釋執行 AST 節點的狀態,並且重新收集 AST 節點的類型信息。之後,Truffle 會再次利用 Graal 編譯器進行新一輪的即時編譯。

據統計,在 JavaScript 方法和 Ruby 方法中,80% 會在 5 次方法調用後穩定下來,90% 會在 7 次調用後穩定下來,99%會在 19 次方法調用之後穩定下來。

 

3.4 Sulong

Sulong子項目是GraalVM為LLVM的中間語言bitcode提供的高新更運行時工具,是基於Truffle框架實現的bitcode解釋器。Sulong為所有可以編譯到LLVM bitcode的語言(如C,C++等)提供了在JVM中執行的解決方案。

 

4 參考

  • 林子熠 《GraalVM與靜態編譯》;
  • 周志明《深入理解Java虛擬機》;
  • Java Developer’s Introduction to GraalVM:-鄭雨迪
  • Truffle/Graal:From Interpreters toOptimizing Compilers via Partial Evaluation:-Carnegie Mellon University

作者:王子豪


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • RabbitMQ 常見問題 昔我往矣,楊柳依依。今我來思,雨雪霏霏。 1、什麼是RabbitMQ? RabbitMQ是一款開源的、Erlang編寫的消息中間件;最大的特點就是消費並不需要確保提供方存在,實現了服務之間的高度解耦,可以用它來:解耦、非同步、削峰。 2、MQ的優點 非同步處理 - 相比於傳統 ...
  • 實現02 3.實現任務階段3-處理Servlet02 3.3Servlet規範設計 3.3.1MyServlet 該類模仿Servlet介面,為了簡化,只聲明瞭三個方法:init(),service(),destroy() package com.li.MyTomcat.servlet; impor ...
  • 通過創建數據表索引,有效提升系統性能。 一、問題背景 在11月10日下午5點,出現channel非同步下發消息隊列消息積壓報警,經排查分析是因為channel請求鑫某億服務商落單時間過長,導致了channel消費消息隊列的消息變慢的情況。所以,專項對鑫某億系統相關業務進行優化。 一(1)、現場 查看當 ...
  • 眾所周知,某度本身就是最大的爬蟲腳本,那麼純純的去某個網站找壁紙,還不如去某度圖片直接找,瞬間格局打開! 話不多說,直接用Python來開發一下此處資源! 開發環境 & 第三方模塊 環境 解釋器版本 >>> python 3.8 代碼編輯器 >>> pycharm 2021.2 模塊 request ...
  • Kafka 常見問題 一年將盡夜,萬里未歸人。 1、Kafka 簡介 Apache Kafka是一個分散式發佈 - 訂閱消息系統和一個強大的隊列, 可以處理大量的數據, 並使您能夠將消息從一個端點傳遞到另一個端點。 Kafka適合離線和線上消息消費,Kafka消息保留在磁碟上, 併在群集內複製以防止 ...
  • 上篇文章介紹了編寫 Yarn Application 的整體框架流程,本篇文章將詳細介紹其中 Client 部分的編寫方式。 一、Yarn Client 編寫方法 本篇代碼已上傳 Github: Github - MyYarnClient 一)編寫流程 1、創建並啟動 Client YarnClie ...
  • 1.1 Java8的概述 Java8於2014年3月發佈,該版本是 Java 語言的一個重要版本,自Java5以來最具革命性的版本,該版本包含語言、編譯器、庫、工具和JVM等方面的多個新特性。 1.2 函數式介面 函數式介面主要指只包含一個抽象方法的介面,如:java.lang.Runnable等。 ...
  • 這篇文章主要介紹如何使用字元串來設置其他值的格式(比如便於列印),並大致瞭解使用字元串方法可完成的重要任務,如拆分、合併和查找等。 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...