偽共用和緩存行填充,從Java 6, Java 7 到Java 8

来源:http://www.cnblogs.com/Binhua-Liu/archive/2016/06/27/5620339.html
-Advertisement-
Play Games

關於偽共用的文章已經很多了,對於多線程編程來說,特別是多線程處理列表和數組的時候,要非常註意偽共用的問題。否則不僅無法發揮多線程的優勢,還可能比單線程性能還差。隨著JAVA版本的更新,再各個版本上減少偽共用的做法都有區別,一不小心代碼可能就失效了,要註意進行測試。這篇文章總結一下。 什麼是偽共用 關... ...


關於偽共用的文章已經很多了,對於多線程編程來說,特別是多線程處理列表和數組的時候,要非常註意偽共用的問題。否則不僅無法發揮多線程的優勢,還可能比單線程性能還差。隨著JAVA版本的更新,再各個版本上減少偽共用的做法都有區別,一不小心代碼可能就失效了,要註意進行測試。這篇文章總結一下。

 

什麼是偽共用

關於偽共用講解最清楚的是這篇文章《剖析Disruptor:為什麼會這麼快?(三)偽共用》,我這裡就直接摘抄其對偽共用的解釋:

 

緩存系統中是以緩存行(cache line)為單位存儲的。緩存行是2的整數冪個連續位元組,一般為32-256個位元組。最常見的緩存行大小是64個位元組。當多線程修改互相獨立的變數時,如 果這些變數共用同一個緩存行,就會無意中影響彼此的性能,這就是偽共用。緩存行上的寫競爭是運行在SMP系統中並行線程實現可伸縮性最重要的限制因素。有 人將偽共用描述成無聲的性能殺手,因為從代碼中很難看清楚是否會出現偽共用。

為了讓可伸縮性與線程數呈線性關係,就必須確保不會有兩個線程往同一個變數或緩存行中寫。兩個線程寫同一個變數可以在代碼中發現。為了確定互相獨立的變數 是否共用了同一個緩存行,就需要瞭解記憶體佈局,或找個工具告訴我們。Intel VTune就是這樣一個分析工具。本文中我將解釋Java對象的記憶體佈局以及我們該如何填充緩存行以避免偽共用。

cache-line.png

圖1說明瞭偽共用的問題。在核心1上運行的線程想更新變數X,同時核心2上的線程想要更新變數Y。不幸的是,這兩個變數在同一個緩存行中。每個線程都要去 競爭緩存行的所有權來更新變數。如果核心1獲得了所有權,緩存子系統將會使核心2中對應的緩存行失效。當核心2獲得了所有權然後執行更新操作,核心1就要 使自己對應的緩存行失效。這會來來回回的經過L3緩存,大大影響了性能。如果互相競爭的核心位於不同的插槽,就要額外橫跨插槽連接,問題可能更加嚴重。

 

JAVA 6下的方案

解決偽共用的辦法是使用緩存行填充,使一個對象占用的記憶體大小剛好為64bit或它的整數倍,這樣就保證了一個緩存行里不會有多個對象。《剖析Disruptor:為什麼會這麼快?(三)偽共用》提供了緩存行填充的例子:

public final class FalseSharing 
    implements Runnable 
{ 
    public final static int NUM_THREADS = 4; // change 
    public final static long ITERATIONS = 500L * 1000L * 1000L; 
    private final int arrayIndex; 
  
    private static VolatileLong[] longs = new VolatileLong[NUM_THREADS]; 
    static 
    { 
        for (int i = 0; i < longs.length; i++) 
        { 
            longs[i] = new VolatileLong(); 
        } 
    } 
  
    public FalseSharing(final int arrayIndex) 
    { 
        this.arrayIndex = arrayIndex; 
    } 
  
    public static void main(final String[] args) throws Exception 
    { 
        final long start = System.nanoTime(); 
        runTest(); 
        System.out.println("duration = " + (System.nanoTime() - start)); 
    } 
  
    private static void runTest() throws InterruptedException 
    { 
        Thread[] threads = new Thread[NUM_THREADS]; 
  
        for (int i = 0; i < threads.length; i++) 
        { 
            threads[i] = new Thread(new FalseSharing(i)); 
        } 
  
        for (Thread t : threads) 
        { 
            t.start(); 
        } 
  
        for (Thread t : threads) 
        { 
            t.join(); 
        } 
    } 
  
    public void run() 
    { 
        long i = ITERATIONS + 1; 
        while (0 != --i) 
        { 
            longs[arrayIndex].value = i; 
        } 
    } 
  
    public final static class VolatileLong 
    { 
        public volatile long value = 0L; 
        public long p1, p2, p3, p4, p5, p6; // comment out 
    } 
}

 

VolatileLong通過填充一些無用的欄位p1,p2,p3,p4,p5,p6,再考慮到對象頭也占用8bit, 剛好把對象占用的記憶體擴展到剛好占64bit(或者64bit的整數倍)。這樣就避免了一個緩存行中載入多個對象。但這個方法現在只能適應JAVA6 及以前的版本了。

 

(註:如果我們的填充使對象size大於64bit,比如多填充16bit – public long p1, p2, p3, p4, p5, p6, p7, p8;。理論上同樣應該避免偽共用問題,但事實是這樣的話執行速度同樣慢幾倍,只比沒有使用填充好一些而已。還沒有理解其原因。所以測試下來,必須是64bit的整數倍)

 

JAVA 7下的方案

上面這個例子在JAVA 7下已經不適用了。因為JAVA 7會優化掉無用的欄位,可以參考《False Sharing && Java 7》。

 

因此,JAVA 7下做緩存行填充更麻煩了,需要使用繼承的辦法來避免填充被優化掉,《False Sharing && Java 7》里的例子我覺得不是很好,於是我自己做了一些優化,使其更通用:

public final class FalseSharing implements Runnable {  
    public static int NUM_THREADS = 4; // change  
    public final static long ITERATIONS = 500L * 1000L * 1000L;  
    private final int arrayIndex;  
    private static VolatileLong[] longs;  
  
    public FalseSharing(final int arrayIndex) {  
        this.arrayIndex = arrayIndex;  
    }  
  
    public static void main(final String[] args) throws Exception {  
        Thread.sleep(10000);  
        System.out.println("starting....");  
        if (args.length == 1) {  
            NUM_THREADS = Integer.parseInt(args[0]);  
        }  
  
        longs = new VolatileLong[NUM_THREADS];  
        for (int i = 0; i < longs.length; i++) {  
            longs[i] = new VolatileLong();  
        }  
        final long start = System.nanoTime();  
        runTest();  
        System.out.println("duration = " + (System.nanoTime() - start));  
    }  
  
    private static void runTest() throws InterruptedException {  
        Thread[] threads = new Thread[NUM_THREADS];  
        for (int i = 0; i < threads.length; i++) {  
            threads[i] = new Thread(new FalseSharing(i));  
        }  
        for (Thread t : threads) {  
            t.start();  
        }  
        for (Thread t : threads) {  
            t.join();  
        }  
    }  
  
    public void run() {  
        long i = ITERATIONS + 1;  
        while (0 != --i) {  
            longs[arrayIndex].value = i;  
        }  
    }  
}
public class VolatileLongPadding {
    public volatile long p1, p2, p3, p4, p5, p6; // 註釋  
}
public class VolatileLong extends VolatileLongPadding {
    public volatile long value = 0L;  
}

 

把padding放在基類裡面,可以避免優化。(這好像沒有什麼道理好講的,JAVA7的記憶體優化演算法問題,能繞則繞)。不過,這種辦法怎麼看都有點煩,借用另外一個博主的話:做個java程式員真難。

 

 

JAVA 8下的方案

在JAVA 8中,緩存行填充終於被JAVA原生支持了。JAVA 8中添加了一個@Contended的註解,添加這個的註解,將會在自動進行緩存行填充。以上的例子可以改為:

public final class FalseSharing implements Runnable {  
    public static int NUM_THREADS = 4; // change  
    public final static long ITERATIONS = 500L * 1000L * 1000L;  
    private final int arrayIndex;  
    private static VolatileLong[] longs;  
  
    public FalseSharing(final int arrayIndex) {  
        this.arrayIndex = arrayIndex;  
    }  
  
    public static void main(final String[] args) throws Exception {  
        Thread.sleep(10000);  
        System.out.println("starting....");  
        if (args.length == 1) {  
            NUM_THREADS = Integer.parseInt(args[0]);  
        }  
  
        longs = new VolatileLong[NUM_THREADS];  
        for (int i = 0; i < longs.length; i++) {  
            longs[i] = new VolatileLong();  
        }  
        final long start = System.nanoTime();  
        runTest();  
        System.out.println("duration = " + (System.nanoTime() - start));  
    }  
  
    private static void runTest() throws InterruptedException {  
        Thread[] threads = new Thread[NUM_THREADS];  
        for (int i = 0; i < threads.length; i++) {  
            threads[i] = new Thread(new FalseSharing(i));  
        }  
        for (Thread t : threads) {  
            t.start();  
        }  
        for (Thread t : threads) {  
            t.join();  
        }  
    }  
  
    public void run() {  
        long i = ITERATIONS + 1;  
        while (0 != --i) {  
            longs[arrayIndex].value = i;  
        }  
    }  
}
import sun.misc.Contended;

@Contended
public class VolatileLong {
    public volatile long value = 0L;  
}

 

執行時,必須加上虛擬機參數-XX:-RestrictContended,@Contended註釋才會生效。很多文章把這個漏掉了,那樣的話實際上就沒有起作用。

 

@Contended註釋還可以添加在欄位上,今後再寫文章詳細介紹它的用法。

 

參考

http://mechanical-sympathy.blogspot.com/2011/07/false-sharing.html

http://mechanical-sympathy.blogspot.hk/2011/08/false-sharing-java-7.html

http://robsjava.blogspot.com/2014/03/what-is-false-sharing.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ...
  • 本篇將詳細介紹Python 類的成員、成員修飾符、類的特殊成員。還有兩個類的綜合運用實例。 環境為:python3.5.1 類的成員 類的成員包括三大類:欄位、方法和屬性 最重要的是:所有成員中,只有普通欄位的內容保存在對象中,即:根據此類創建了多少對象,在記憶體中就有多少個普通欄位。而其他的成員,則 ...
  • 本篇主要是來分享從頭開始搭建一個dubbo+zookeeper平臺的過程,其中會簡要介紹下dubbo服務的作用。 ...
  • 轉自:http://www.cnblogs.com/semcoding/p/3347600.html PHPCMS V9 結構設計 根目錄 |–api 結構文件目錄 |–caches 緩存文件目錄 |– configs 系統配置文件目錄 |– caches_* 系統緩存目錄 |–phpcms php... ...
  • 閱讀目錄 1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 閱讀目錄 1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 序. multi ...
  • 本文講述的是log4cplus日誌輸出到qt widget,封裝了serverSocket。 log4cplus支持用戶自定義輸出設備,只需要繼承自Appender,或者Appender子類,並實現append成員方法,然後在 log4cplus初始化成功之後,把自定義輸出設備添加到logger中, ...
  • jdk自帶註解 ①@Override覆蓋父類方法時顯示 ②@Deprecated定義過時的方法 @SuppressWarnings忽略過時函數的警告 廢話少說,上個例子 /////////////////////////////////////////Person.java://////////// ...
  • 因為項目用到DataTable表格載入後臺數據,要連表查詢虛擬機選中的策略狀態,所以想到先把策略表內容取出來,組成一個'<select><option value="1"></option>[n個option]</select>'字元串,在遍歷虛擬機列表時把他的策略值拼成 'value="1"' 這 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...