在讀《深入理解JVM虛擬機》這本書前兩章的時候整理了JDK從1.0到最新版本發展史,其中記錄了JDK這麼多年來演進過程中的一些趣聞及引人註目的一些特性,在調研JDK19新增特性的時候瞭解到了虛擬線程這個概念,於是對虛擬線程進行學習整理內容如下。 ...
1.前言
在讀《深入理解JVM虛擬機》這本書前兩章的時候整理了JDK從1.0到最新版本發展史,其中記錄了JDK這麼多年來演進過程中的一些趣聞及引人註目的一些特性,在調研JDK19新增特性的時候瞭解到了虛擬線程這個概念,於是對虛擬線程進行學習整理內容如下。
2.虛擬線程介紹?
虛擬線程(Virtual Threads)就猶如名字一樣,並非傳統意義上的JAVA線程。傳統意義上的JAVA線程(以下稱為平臺線程)跟操作系統的內核線程是一一映射的關係(如圖1所示)。而對於平臺線程的創建和銷毀所帶來的開銷是非常大的,所以JAVA採用線程池的方式來維護平臺線程而避免線程的反覆創建和銷毀。
然而平臺線程也會占用記憶體、CPU資源,往往在CPU和網路連接成為系統瓶頸前,平臺線程首當其衝的會成為系統瓶頸。在單台伺服器硬體資源確定的情況下,平臺線程的數量同樣也會因為硬體資源而受到限制,也成為單台伺服器吞吐量提升的主要障礙。
圖1 平臺線程和系統線程映射關係
談回虛擬線程,虛擬線程則是由JDK而非操作系統提供的一種線程輕量級實現,它相較於平臺線程而言具有以下特性:
- 不依賴於平臺線程的數量;
- 不會增加額外的上下文切換開銷;
- 不會在代碼的整個生命周期中阻塞系統線程;
- 整個虛擬線程的維護是通過JVM進行管理,作為普通的JAVA對象存放在RAM中。
那麼意味著若幹的虛擬線程可以在同一個系統線程上運行應用程式的代碼(如圖2所示),只有在虛擬線程執行的時候才會消耗系統線程,在等待和休眠時不會阻塞系統線程。
圖2 虛擬線程和平臺線程映射關係
相較於平臺線程而言,虛擬線程是一種非常廉價和豐富的線程,可以說虛擬線程的數量是一種近乎於無限多的線程,它對硬體的利用率接近於最好,在相同硬體配置伺服器的情況下,虛擬線程比使用平臺線程具備更高的併發性,從而提升整個應用程式的吞吐量。如果說平臺線程和系統線程調度為1:1的方式,虛擬線程則採用M:N的調度方式,其中大量的虛擬線程M在較少的系統線程N上運行。
3.虛擬線程如何被JVM調度呢?
圖3 JVM調度虛擬線程流程圖
- 先創建一個虛擬線程,此時JVM會將虛擬線程裝載在平臺線程上,平臺線程則會去綁定一個系統線程。
- JVM會使用調度程式去使用調度線程執行虛擬線程中的任務。
- 任務執行完成之後清空上下文變數,將調度線程返還至調度程式等待處理下一個任務。
4.虛擬線程的目標、非目標?
目標:
- 為java.lang.Thread增加一種額外的實現,即虛擬線程,它能做到在幾個G的JVM堆上創建幾百萬個活動的虛擬線程(這在現在的JDK中幾乎不可能實現),並且表現出和現在的線程幾乎一樣的行為。
- 對虛擬線程問題定位也可以通過已經存在的JDK工具,儘可能保持和現在的線程相似的方式。
在 Java 中,經典線程是 java.lang.Thread 類的實例。後面我們也將它們稱為平臺線程。
非目標:
- 虛擬線程不是為了改變現在這種操作系統級別的線程的實現。
- 虛擬線程不是為了自動將已經存在的線程構造方法自動轉為虛擬線程。
- 虛擬線程不是為了改變JMM。
- 虛擬線程不是為了增加一種新的內部線程通信機制。
- 除了並行流之外,虛擬線程也不是為了提供一種新的數據並行結構。
5.如何創建虛擬線程?
- 使用Thread.startVirtualThread()
此方法創建一個新的虛擬線程來執行給定的 Runnable 任務。
Runnable runnable = () -> System.out.println("Virtual Thread");
Thread.startVirtualThread(runnable);
//or
Thread.startVirtualThread(() -> {
//Code to execute in virtual thread
System.out.println("Virtual Thread");
});
- 使用Thread.Builder
如果我們想在創建線程後顯式啟動它,我們可以使用 Thread.ofVirtual() 返回一個 VirtualThreadBuilder 實例。它的 start() 方法啟動一個虛擬線程。這裡的 Thread.ofVirtual().start(runnable) 等價於 Thread.startVirtualThread(runnable)。
ThreadFactory factory = Thread.ofVirtual().factory();
我們可以使用Thread.Builder引用來創建和啟動多個線程。
Runnable runnable = () -> System.out.println("Virtual Thread");
Thread.Builder builder = Thread.ofVirtual().name("Virtual-Thread");
Thread t1 = builder.start(runnable);
Thread t2 = builder.start(runnable);
類似的 APIThread.ofPlatform()也可用於創建平臺線程。
Thread.Builder builder = Thread.ofPlatform().name("Platform-Thread");
Thread t1 = builder.start(() -> {...});
Thread t2 = builder.start(() -> {...});
- 使用Executors.newVirtualThreadPerTaskExecutor()
此方法為每個任務創建一個新的虛擬線程。 Executor 創建的線程數是無限的。
try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
IntStream.range(0, 10_000).forEach(i -> {
executor.submit(() -> {
Thread.sleep(Duration.ofSeconds(1));
return i;
});
});
}
6.平臺線程和虛擬線程的區別?
圖4 虛擬線程生命周期
- 虛擬線程始終是守護線程。 Thread.setDaemon(false) 方法不能將虛擬線程更改為非守護線程。
請註意,當所有啟動的非守護線程都終止時,JVM 終止。這意味著 JVM 在退出之前不會等待虛擬線程完成。
Thread virtualThread = ...; //創建虛擬線程
//virtualThread.setDaemon(true); //沒有作用
- 虛擬線程始終具有正常優先順序,並且即使使用setPriority(n)方法,也無法更改優先順序。在虛擬線程上使用此方法無效。
Thread virtualThread = ...; //創建虛擬線程
//virtualThread.setPriority(Thread.MAX_PRIORITY); //沒有作用
- 虛擬線程不是線程組的活動成員。在虛擬線程上調用時,Thread.getThreadGroup()返回一個名為VirtualThreads的占位符線程組。
- 虛擬線程不支持stop()、suspend()或resume()方法。
這些方法在虛擬線程上調用時會引發UnsupportedOperationException。
- 虛擬線程由JVM調度,JVM將VT分配給平臺線程的動作稱為掛載(mount),取消分配的動作稱為卸載(unmount),線程狀態如下
// 初始狀態
private static final int NEW = 0;
// 線程啟動,由於虛擬線程的run()是個空方法,此時尚未開始執行任務
// 真正的任務執行在cont.run
private static final int STARTED = 1;
// 可執行,尚未分配平臺線程
private static final int RUNNABLE = 2;
// 可執行,已分配平臺線程
private static final int RUNNING = 3;
// 線程嘗試park
private static final int PARKING = 4;
// 從平臺線程卸載
private static final int PARKED = 5;
// cont.yield失敗,未從平臺線程卸載
private static final int PINNED = 6;
// 嘗試cont.yield
private static final int YIELDING = 7;
// 終結態
private static final int TERMINATED = 99;
7.實例場景分析平臺線程和虛擬線程的性能:
任務說明:在控制臺中列印一條消息之前等待1秒,現在使用Runnable創建10000個線程,用虛擬線程和平臺線程執行它們,來比較兩者的性能。我們將使用Duration.between()api 來測量執行所有任務的經過時間。
首先,我們使用一個包含 100 個平臺線程的池。這樣,Executor 一次可以運行 100 個任務,其他任務需要等待。由於我們有 10,000 個任務,因此完成執行的總時間約為 100 秒。
Instant start = Instant.now();
try (var executor = Executors.newFixedThreadPool(100)) {
for(int i = 0; i < 10_000; i++) {
executor.submit(runnable);
}
}
Instant finish = Instant.now();
long timeElapsed = Duration.between(start, finish).toMillis();
System.out.println("Total elapsed time : " + timeElapsed);
輸出
Total elapsed time : 101152 //大概 101 秒
接下來,我們將Executors.newFixedThreadPool(100)替換為Executors.newVirtualThreadPerTaskExecutor()。這將在虛擬線程而不是平臺線程中執行所有任務。
Instant start = Instant.now();
try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
for(int i = 0; i < 10_000; i++) {
executor.submit(runnable);
}
}
Instant finish = Instant.now();
long timeElapsed = Duration.between(start, finish).toMillis();
System.out.println("Total elapsed time : " + timeElapsed);
輸出
Total elapsed time : 1589 // 大概 1.5 秒
請註意虛擬線程的超快性能將執行時間從 100 秒減少到 1.5 秒,而 Runnable 代碼沒有任何變化。 其他實際場景:https://zhuanlan.zhihu.com/p/604507117?utm_id=0
8.使用虛擬線程需要註意什麼?
- 不要建虛擬線程池
Java 線程池旨在避免創建新操作系統線程的開銷,因為創建它們是一項昂貴的操作。但是創建虛擬線程並不昂貴,因此永遠不需要將它們池化。建議每次需要時創建一個新的虛擬線程。 請註意,使用虛擬線程後,我們的應用程式可能能夠處理數百萬個線程,但其他系統或平臺一次只能處理幾個請求。例如,我們可以只有幾個資料庫連接或與其他伺服器的網路連接。 在這些情況下,也不要使用線程池。相反,使用信號量來確保只有指定數量的線程正在訪問該資源。
private static final Semaphore SEMAPHORE = new Semaphore(50);
SEMAPHORE.acquire();
try {
// 信號量被控制在 50 來訪問請求
// 訪問資料庫或資源
} finally {
SEMAPHORE.release();
}
- 避免使用線程局部變數 (ThreadLocal)
虛擬線程支持線程局部行為的方式與平臺線程相同,但由於虛擬線程可以創建數百萬個,因此只有在仔細考慮後才能使用線程局部變數。 例如,如果我們在應用程式中擴展一百萬個虛擬線程,那麼將有一百萬個 ThreadLocal 實例以及它們所引用的數據。如此大量的實例會給記憶體帶來很大的負擔,應該避免。
- 使用 ReentrantLock 而不是同步塊
有兩種特定場景,虛擬線程可以阻塞平臺線程(稱為 OS 線程的固定)。 1、當它在同步塊或同步方法內執行代碼時 2、當它執行本地方法或外部函數時 這種同步塊不會使應用程式出錯,但它會限制應用程式的可擴展性,類似於平臺線程。 如果一個方法使用非常頻繁並且它使用同步塊,則考慮將其替換為 ReentrantLock 機制。
public synchronized void m() {
try {
// ... 訪問資源
} finally {
//
}
}
private final ReentrantLock lock = new ReentrantLock();
public void m() {
lock.lock(); // 阻塞
try {
// ... 訪問資源
} finally {
lock.unlock();
}
}
9.結論
長期以來,傳統的 Java 線程一直很好用。隨著微服務領域對可擴展性和高吞吐量的需求不斷增長,虛擬線程將被證明是 Java 歷史上的一個裡程碑特性。使用虛擬線程,一個程式可以用少量的物理記憶體和計算資源處理數百萬個線程,這是傳統平臺線程無法做到的。當與結構化併發相結合時,它還將導致編寫更好的程式。
作者:京東科技 宋慧超
來源:京東雲開發者社區 轉載請註明來源