初步探索GraalVM——雲原生時代JVM黑科技

来源:https://www.cnblogs.com/Jcloud/archive/2022/11/17/16898539.html
-Advertisement-
Play Games

1 雲原生時代Java語言的困境 經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。 雲原生時代,J ...


1 雲原生時代Java語言的困境

經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。

雲原生時代,Java語言一次編譯到處運行的優勢不復存在,理論上使用容器化技術,所有語言都能部署上雲,而無法脫離JVM的Java應用往往要面對JDK記憶體占用比應用本身還大的窘境;Java動態載入、卸載的特性也使得構建的應用鏡像中有一半以上的無用代碼和依賴這些都使得Java應用占用記憶體相當多。而啟動時間長,性能達到峰值的時間長使得在Serverless等場景下無法與Go、Node.js等快速語言競爭。

Java應用程式的運行生命周期示意圖

2 GraalVM

面對雲原生時代Java的不適,GraalVM或許是最好的解藥。GraalVM是Oracle實驗室推出的基於Java開發的開源高性能多語言運行時平臺,它既可以在傳統的 OpenJDK 上運行,也可以通過 AOT(Ahead-Of-Time)編譯成可執行文件單獨運行,甚至可以集成至資料庫中運行。除此之外,它還移除了編程語言之間的邊界,並且支持通過即時編譯技術,將混雜了不同的編程語言的代碼編譯到同一段二進位碼之中,從而實現不同語言之間的無縫切換。

 

本文主要簡單從三個方面介紹GraalVM可以為我們帶來的改變:

1)基於Java的Graal Compiler的出現對學習和研究虛擬機代碼編譯技術有著不可估量的價值,相比C++編寫的複雜無比的服務端編譯器,不管是對編譯器的優化還是學習的成本都大大的降低。
2)靜態編譯框架Substrate VM框架,為Java在雲原生時代提供了與其他語言競爭的可能,大大的減少了Java應用占用記憶體,並且可以加快啟動速度幾十倍。

 

3)以Truffle和Sulong為代表的中間語言解釋器,開發者可以使用Truffle提供的API快速用Java實現一種語言的解釋器,從而實現了在JVM平臺上運行其他語言的效果,為Java世界帶來了更多更有想象力的可能性。

GraalVM多語言支持

3 GraalVM整體結構

graal
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── SECURITY.md
├── THIRD_PARTY_LICENSE.txt
├── bench-common.libsonnet
├── ci-resources.libsonnet
├── ci.hocon
├── ci.jsonnet
├── ci_includes
├── common-utils.libsonnet
├── common.hocon
├── common.json
├── common.jsonnet
├── compiler
├── docs
├── espresso
├── graal-common.json
├── java-benchmarks
├── regex
├── repo-configuration.libsonnet
├── sdk
├── substratevm
├── sulong
├── tools
├── truffle
├── vm
└── wasm

3.1 Compiler

Compiler子項目全稱GraalVM編譯器,是用Java語言編寫的Java編譯器。高編譯效率、高輸出質量、同時支持提前編譯(AOT)和即時編譯(JIT)、同時支持應用於包括HotSpot在內的不同虛擬機的編譯器。

與C2採用一樣的中間表示形式(Sea of Nodes IR),後端優化上直接繼承了大量來自於HotSpot的服務端編譯器的高質量優化技術,是現在高校、研究院和企業編譯研究實踐的主要平臺。

Graal Compiler是GraalVM與HotSpotVM(從JDK10起)共同擁有的服務端即時編譯器,是C2編譯器未來的替代者。為了讓 Java 虛擬機與編譯器解耦,ORACLE引入了Java-Level JVM Compiler Interface(JVMCI)Jep 243 :把編譯器從虛擬機中抽離出來,並且可以通過介面與虛擬機交流(https://openjdk.java.net/jeps/243)

 

具體來說,即時編譯器與 Java 虛擬機的交互可以分為如下三個方面。

  1. 響應編譯請求;
  2. 獲取編譯所需的元數據(如類、方法、欄位)和反映程式執行狀態的 profile;
  3. 將生成的二進位碼部署至代碼緩存(code cache)里。

 

 

 


oracle提供的編譯時間差異示例

3.2 Substrate VM

Substrate VM提供了將Java程式靜態編譯為本地代碼的編譯工具鏈,包括了編譯框架、靜態分析工具、C++支持框架及運行時支持等。在程式運行前便將位元組碼轉換為機器碼

優點:

  1. 從指定的編譯入口開始靜態可達性分析,有效的控制了編譯範圍,解決了代碼膨脹的問題;
  2. 實現了多種運行時優化例如:傳統的java類是在第一次被用到時初始化的,之後每次調用時還要再檢查是否初始化過,GraalVM將其優化為在編譯時初始化;
  3. 無需在運行過程中耗費CPU資源來進行即時編譯,而程式也能在啟動一開始就達到理想的性能;

缺點:

  1. 靜態分析是資源密集型計算,需要消耗大量CPU、記憶體和時間;
  2. 靜態分析對反射、JNI、動態代理的分析能力非常有限,目前GraalVM只能通過額外配置的方式加以解決;
  3. Java序列化也有多項違反封閉性假設的動態特性:反射,JNI,動態類載入,目前GraalVM也需要通過額外配置解決,且不能處理所有序列化,例如Lambda對象的序列化,而且性能是JDK的一半;

 

 


啟動時長對比

 


占用記憶體對比

3.3 Truffle

我們知道一般編譯器分為前端和後端,前端負責詞法分析、語法分析、類型檢查和中間代碼生成,後端負責編譯優化和目標代碼生成。一種比較取巧的做法是將新語言編譯成某種已知語言,如Scala、Kotlin可以編譯成Java位元組碼,這樣就可以直接享用JVM的JIT、GC等各項優化,這種做法都是針對的編譯型語言。與之相對的,如JavaScript、Ruby、R、Python等解釋型語言,它們依賴於解釋執行器進行解析並執行,為了讓這類解釋型語言能夠更高效的執行,開發人員通常需要開發虛擬機,並實現垃圾回收,即時編譯等組件,讓該語言在虛擬機中執行,如Google的V8引擎。如果能讓這些語言也可以在JVM上運行並復用JVM的各種優化方案,將會減少許多重覆造輪子的消耗。這也是Truffle項目的目標。

Truffle是一個用Java編寫的解釋器實現框架。它提供瞭解釋器的開發框架介面,可以幫助開發人員用Java為自己感興趣的語言快速開發處語言解釋器,目前已經實現並維護了JavaScript、Ruby、R、Python等語言。

只需基於Truffle實現相關語言的詞法分析器、語法分析器及針對語法分析所生成的抽象語法樹(AST)的解釋執行器,便可以運行在任何Java虛擬機上,享用JVM提供的各項運行時優化。

 


GraalVM多語言運行時性能加速比

3.3.1 Partial Evaluation

Truffle的實現原理基於Partial Evaluation這一概念:假設程式prog為將輸入轉為輸出

 

其中Istatic為靜態數據,在編譯時已知常量,Idynamic為編譯時未知數據,則可以將程式等價為:

 

新程式prog為prog的特化,他應該會比原程式更高效的執行,這個從prog轉換到prog的過程便稱為Partial Evaluation。我們可以將Truffle預壓的解釋執行器當成prog,將某段由Truffle語言寫的程式當做Istatic,並通過Partial Evaluation將prog轉換到prog*。

下麵引用一個Oracle官方的例子來講解,以下程式實現了讀取參數以及參數相加的操作,需要實現讀取三個參數相加:

 

這段程式解析生成的AST為

sample = new Add(new Add(new Arg(0), new Arg(1)), new Arg(2));

 

經過Partial Evaluator 的不斷進行方法內聯最終會變成下述代碼:

 

3.3.2 節點重寫

節點重寫是Truffle的另一項關鍵優化。

在動態語言中許多變數的類型是在運行時才能確定的,以“加法”舉例,符號+即可以表示整型相加也可以表示浮點型相加。Truffle的語言解釋器會收集每個AST節點所代表的操作類型(profile),並且在編譯時做出針對所收集到的profile進行優化,如:若收集到的profile顯示這是一個整型加法操作,Truffle會在即時編譯時將AST進行變形,將“+”視為整型加法。

當然,這種優化也會有錯誤的時候,比如上述加法操作既有可能是整數加法也可能是字元串加法,此時若AST樹已變形,那麼我們只好丟棄編譯後的機器代碼,回退到AST解釋執行。這種基於類型 profile 的優化,背後的核心就是基於假設的投機性優化,以及在假設失敗時的去優化。

 

在即時編譯過後,如果運行過程中發現 AST 節點的實際類型和所假設的類型不同,Truffle 會主動調用 Graal 編譯器提供的去優化 API,返回至解釋執行 AST 節點的狀態,並且重新收集 AST 節點的類型信息。之後,Truffle 會再次利用 Graal 編譯器進行新一輪的即時編譯。

據統計,在 JavaScript 方法和 Ruby 方法中,80% 會在 5 次方法調用後穩定下來,90% 會在 7 次調用後穩定下來,99%會在 19 次方法調用之後穩定下來。

 

3.4 Sulong

Sulong子項目是GraalVM為LLVM的中間語言bitcode提供的高新更運行時工具,是基於Truffle框架實現的bitcode解釋器。Sulong為所有可以編譯到LLVM bitcode的語言(如C,C++等)提供了在JVM中執行的解決方案。

 

4 參考

  • 林子熠 《GraalVM與靜態編譯》;
  • 周志明《深入理解Java虛擬機》;
  • Java Developer’s Introduction to GraalVM:-鄭雨迪
  • Truffle/Graal:From Interpreters toOptimizing Compilers via Partial Evaluation:-Carnegie Mellon University

作者:王子豪


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • RabbitMQ 常見問題 昔我往矣,楊柳依依。今我來思,雨雪霏霏。 1、什麼是RabbitMQ? RabbitMQ是一款開源的、Erlang編寫的消息中間件;最大的特點就是消費並不需要確保提供方存在,實現了服務之間的高度解耦,可以用它來:解耦、非同步、削峰。 2、MQ的優點 非同步處理 - 相比於傳統 ...
  • 實現02 3.實現任務階段3-處理Servlet02 3.3Servlet規範設計 3.3.1MyServlet 該類模仿Servlet介面,為了簡化,只聲明瞭三個方法:init(),service(),destroy() package com.li.MyTomcat.servlet; impor ...
  • 通過創建數據表索引,有效提升系統性能。 一、問題背景 在11月10日下午5點,出現channel非同步下發消息隊列消息積壓報警,經排查分析是因為channel請求鑫某億服務商落單時間過長,導致了channel消費消息隊列的消息變慢的情況。所以,專項對鑫某億系統相關業務進行優化。 一(1)、現場 查看當 ...
  • 眾所周知,某度本身就是最大的爬蟲腳本,那麼純純的去某個網站找壁紙,還不如去某度圖片直接找,瞬間格局打開! 話不多說,直接用Python來開發一下此處資源! 開發環境 & 第三方模塊 環境 解釋器版本 >>> python 3.8 代碼編輯器 >>> pycharm 2021.2 模塊 request ...
  • Kafka 常見問題 一年將盡夜,萬里未歸人。 1、Kafka 簡介 Apache Kafka是一個分散式發佈 - 訂閱消息系統和一個強大的隊列, 可以處理大量的數據, 並使您能夠將消息從一個端點傳遞到另一個端點。 Kafka適合離線和線上消息消費,Kafka消息保留在磁碟上, 併在群集內複製以防止 ...
  • 上篇文章介紹了編寫 Yarn Application 的整體框架流程,本篇文章將詳細介紹其中 Client 部分的編寫方式。 一、Yarn Client 編寫方法 本篇代碼已上傳 Github: Github - MyYarnClient 一)編寫流程 1、創建並啟動 Client YarnClie ...
  • 1.1 Java8的概述 Java8於2014年3月發佈,該版本是 Java 語言的一個重要版本,自Java5以來最具革命性的版本,該版本包含語言、編譯器、庫、工具和JVM等方面的多個新特性。 1.2 函數式介面 函數式介面主要指只包含一個抽象方法的介面,如:java.lang.Runnable等。 ...
  • 這篇文章主要介紹如何使用字元串來設置其他值的格式(比如便於列印),並大致瞭解使用字元串方法可完成的重要任務,如拆分、合併和查找等。 ...
一周排行
    -Advertisement-
    Play Games
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...
  • 目錄前言PostgreSql安裝測試額外Nuget安裝Person.cs模擬運行Navicate連postgresql解決方案Garnet為什麼要選擇Garnet而不是RedisRedis不再開源Windows版的Redis是由微軟維護的Windows Redis版本老舊,後續可能不再更新Garne ...
  • C#TMS系統代碼-聯表報表學習 領導被裁了之後很快就有人上任了,幾乎是無縫銜接,很難讓我不想到這早就決定好了。我的職責沒有任何變化。感受下來這個系統封裝程度很高,我只要會調用方法就行。這個系統交付之後不會有太多問題,更多應該是做小需求,有大的開發任務應該也是第二期的事,嗯?怎麼感覺我變成運維了?而 ...
  • 我在隨筆《EAV模型(實體-屬性-值)的設計和低代碼的處理方案(1)》中介紹了一些基本的EAV模型設計知識和基於Winform場景下低代碼(或者說無代碼)的一些實現思路,在本篇隨筆中,我們來分析一下這種針對通用業務,且只需定義就能構建業務模塊存儲和界面的解決方案,其中的數據查詢處理的操作。 ...
  • 對某個遠程伺服器啟用和設置NTP服務(Windows系統) 打開註冊表 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\NtpServer 將 Enabled 的值設置為 1,這將啟用NTP伺服器功 ...
  • title: Django信號與擴展:深入理解與實踐 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 後端開發 tags: Django 信號 松耦合 觀察者 擴展 安全 性能 第一部分:Django信號基礎 Djan ...
  • 使用xadmin2遇到的問題&解決 環境配置: 使用的模塊版本: 關聯的包 Django 3.2.15 mysqlclient 2.2.4 xadmin 2.0.1 django-crispy-forms >= 1.6.0 django-import-export >= 0.5.1 django-r ...
  • 今天我打算整點兒不一樣的內容,通過之前學習的TransformerMap和LazyMap鏈,想搞點不一樣的,所以我關註了另外一條鏈DefaultedMap鏈,主要調用鏈為: 調用鏈詳細描述: ObjectInputStream.readObject() DefaultedMap.readObject ...
  • 後端應用級開發者該如何擁抱 AI GC?就是在這樣的一個大的浪潮下,我們的傳統的應用級開發者。我們該如何選擇職業或者是如何去快速轉型,跟上這樣的一個行業的一個浪潮? 0 AI金字塔模型 越往上它的整個難度就是職業機會也好,或者說是整個的這個運作也好,它的難度會越大,然後越往下機會就會越多,所以這是一 ...
  • @Autowired是Spring框架提供的註解,@Resource是Java EE 5規範提供的註解。 @Autowired預設按照類型自動裝配,而@Resource預設按照名稱自動裝配。 @Autowired支持@Qualifier註解來指定裝配哪一個具有相同類型的bean,而@Resourc... ...