死磕 java集合之ConcurrentHashMap源碼分析(一)

来源:https://www.cnblogs.com/tong-yuan/archive/2019/04/08/10674283.html
-Advertisement-
Play Games

死磕 java集合之ConcurrentHashMap源碼分析(一) 它的存儲結構是什麼樣的? 它使用了哪些鎖? 它是怎麼擴容的? 它是否是強一致性的? 它不能解決哪些問題? 它的源碼中使用了哪些不常見的技術? ...


開篇問題

(1)ConcurrentHashMap與HashMap的數據結構是否一樣?

(2)HashMap在多線程環境下何時會出現併發安全問題?

(3)ConcurrentHashMap是怎麼解決併發安全問題的?

(4)ConcurrentHashMap使用了哪些鎖?

(5)ConcurrentHashMap的擴容是怎麼進行的?

(6)ConcurrentHashMap是否是強一致性的?

(7)ConcurrentHashMap不能解決哪些問題?

(8)ConcurrentHashMap中有哪些不常見的技術值得學習?

簡介

ConcurrentHashMap是HashMap的線程安全版本,內部也是使用(數組 + 鏈表 + 紅黑樹)的結構來存儲元素。

相比於同樣線程安全的HashTable來說,效率等各方面都有極大地提高。

各種鎖簡介

這裡先簡單介紹一下各種鎖,以便下文講到相關概念時能有個印象。

(1)synchronized

java中的關鍵字,內部實現為監視器鎖,主要是通過對象監視器在對象頭中的欄位來表明的。

synchronized從舊版本到現在已經做了很多優化了,在運行時會有三種存在方式:偏向鎖,輕量級鎖,重量級鎖。

偏向鎖,是指一段同步代碼一直被一個線程訪問,那麼這個線程會自動獲取鎖,降低獲取鎖的代價。

輕量級鎖,是指當鎖是偏向鎖時,被另一個線程所訪問,偏向鎖會升級為輕量級鎖,這個線程會通過自旋的方式嘗試獲取鎖,不會阻塞,提高性能。

重量級鎖,是指當鎖是輕量級鎖時,當自旋的線程自旋了一定的次數後,還沒有獲取到鎖,就會進入阻塞狀態,該鎖升級為重量級鎖,重量級鎖會使其他線程阻塞,性能降低。

(2)CAS

CAS,Compare And Swap,它是一種樂觀鎖,認為對於同一個數據的併發操作不一定會發生修改,在更新數據的時候,嘗試去更新數據,如果失敗就不斷嘗試。

(3)volatile(非鎖)

java中的關鍵字,當多個線程訪問同一個變數時,一個線程修改了這個變數的值,其他線程能夠立即看得到修改的值。(這裡牽涉到java記憶體模型的知識,感興趣的同學可以自己查查相關資料)

volatile只保證可見性,不保證原子性,比如 volatile修改的變數 i,針對i++操作,不保證每次結果都正確,因為i++操作是兩步操作,相當於 i = i +1,先讀取,再加1,這種情況volatile是無法保證的。

(4)自旋鎖

自旋鎖,是指嘗試獲取鎖的線程不會阻塞,而是迴圈的方式不斷嘗試,這樣的好處是減少線程的上下文切換帶來的開鎖,提高性能,缺點是迴圈會消耗CPU。

(5)分段鎖

分段鎖,是一種鎖的設計思路,它細化了鎖的粒度,主要運用在ConcurrentHashMap中,實現高效的併發操作,當操作不需要更新整個數組時,就只鎖數組中的一項就可以了。

(5)ReentrantLock

可重入鎖,是指一個線程獲取鎖之後再嘗試獲取鎖時會自動獲取鎖,可重入鎖的優點是避免死鎖。

其實,synchronized也是可重入鎖。

源碼分析

構造方法

public ConcurrentHashMap() {
}

public ConcurrentHashMap(int initialCapacity) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException();
    int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
            MAXIMUM_CAPACITY :
            tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
    this.sizeCtl = cap;
}

public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
    this.sizeCtl = DEFAULT_CAPACITY;
    putAll(m);
}

public ConcurrentHashMap(int initialCapacity, float loadFactor) {
    this(initialCapacity, loadFactor, 1);
}

public ConcurrentHashMap(int initialCapacity,
                         float loadFactor, int concurrencyLevel) {
    if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
        throw new IllegalArgumentException();
    if (initialCapacity < concurrencyLevel)   // Use at least as many bins
        initialCapacity = concurrencyLevel;   // as estimated threads
    long size = (long)(1.0 + (long)initialCapacity / loadFactor);
    int cap = (size >= (long)MAXIMUM_CAPACITY) ?
            MAXIMUM_CAPACITY : tableSizeFor((int)size);
    this.sizeCtl = cap;
}

構造方法與HashMap對比可以發現,沒有了HashMap中的threshold和loadFactor,而是改用了sizeCtl來控制,而且只存儲了容量在裡面,那麼它是怎麼用的呢?官方給出的解釋如下:

(1)-1,表示有線程正在進行初始化操作

(2)-(1 + nThreads),表示有n個線程正在一起擴容

(3)0,預設值,後續在真正初始化的時候使用預設容量

(4)> 0,初始化或擴容完成後下一次的擴容門檻

至於,官方這個解釋對不對我們後面再討論。

添加元素

public V put(K key, V value) {
    return putVal(key, value, false);
}

final V putVal(K key, V value, boolean onlyIfAbsent) {
    // key和value都不能為null
    if (key == null || value == null) throw new NullPointerException();
    // 計算hash值
    int hash = spread(key.hashCode());
    // 要插入的元素所在桶的元素個數
    int binCount = 0;
    // 死迴圈,結合CAS使用(如果CAS失敗,則會重新取整個桶進行下麵的流程)
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            // 如果桶未初始化或者桶個數為0,則初始化桶
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 如果要插入的元素所在的桶還沒有元素,則把這個元素插入到這個桶中
            if (casTabAt(tab, i, null,
                    new Node<K,V>(hash, key, value, null)))
                // 如果使用CAS插入元素時,發現已經有元素了,則進入下一次迴圈,重新操作
                // 如果使用CAS插入元素成功,則break跳出迴圈,流程結束
                break;                   // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            // 如果要插入的元素所在的桶的第一個元素的hash是MOVED,則當前線程幫忙一起遷移元素
            tab = helpTransfer(tab, f);
        else {
            // 如果這個桶不為空且不在遷移元素,則鎖住這個桶(分段鎖)
            // 並查找要插入的元素是否在這個桶中
            // 存在,則替換值(onlyIfAbsent=false)
            // 不存在,則插入到鏈表結尾或插入樹中
            V oldVal = null;
            synchronized (f) {
                // 再次檢測第一個元素是否有變化,如果有變化則進入下一次迴圈,從頭來過
                if (tabAt(tab, i) == f) {
                    // 如果第一個元素的hash值大於等於0(說明不是在遷移,也不是樹)
                    // 那就是桶中的元素使用的是鏈表方式存儲
                    if (fh >= 0) {
                        // 桶中元素個數賦值為1
                        binCount = 1;
                        // 遍歷整個桶,每次結束binCount加1
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                            (ek != null && key.equals(ek)))) {
                                // 如果找到了這個元素,則賦值了新值(onlyIfAbsent=false)
                                // 並退出迴圈
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                // 如果到鏈表尾部還沒有找到元素
                                // 就把它插入到鏈表結尾並退出迴圈
                                pred.next = new Node<K,V>(hash, key,
                                        value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) {
                        // 如果第一個元素是樹節點
                        Node<K,V> p;
                        // 桶中元素個數賦值為2
                        binCount = 2;
                        // 調用紅黑樹的插入方法插入元素
                        // 如果成功插入則返回null
                        // 否則返回尋找到的節點
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                value)) != null) {
                            // 如果找到了這個元素,則賦值了新值(onlyIfAbsent=false)
                            // 並退出迴圈
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            // 如果binCount不為0,說明成功插入了元素或者尋找到了元素
            if (binCount != 0) {
                // 如果鏈表元素個數達到了8,則嘗試樹化
                // 因為上面把元素插入到樹中時,binCount只賦值了2,並沒有計算整個樹中元素的個數
                // 所以不會重覆樹化
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                // 如果要插入的元素已經存在,則返回舊值
                if (oldVal != null)
                    return oldVal;
                // 退出外層大迴圈,流程結束
                break;
            }
        }
        }
        // 成功插入元素,元素個數加1(是否要擴容在這個裡面)
        addCount(1L, binCount);
        // 成功插入元素返回null
        return null;
    }

整體流程跟HashMap比較類似,大致是以下幾步:

(1)如果桶數組未初始化,則初始化;

(2)如果待插入的元素所在的桶為空,則嘗試把此元素直接插入到桶的第一個位置;

(3)如果正在擴容,則當前線程一起加入到擴容的過程中;

(4)如果待插入的元素所在的桶不為空且不在遷移元素,則鎖住這個桶(分段鎖);

(5)如果當前桶中元素以鏈表方式存儲,則在鏈表中尋找該元素或者插入元素;

(6)如果當前桶中元素以紅黑樹方式存儲,則在紅黑樹中尋找該元素或者插入元素;

(7)如果元素存在,則返回舊值;

(8)如果元素不存在,整個Map的元素個數加1,並檢查是否需要擴容;

添加元素操作中使用的鎖主要有(自旋鎖 + CAS + synchronized + 分段鎖)。

為什麼使用synchronized而不是ReentrantLock?

因為synchronized已經得到了極大地優化,在特定情況下並不比ReentrantLock差。


未完待續~~


qrcode


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言 說到分散式緩存,可能大多數人腦海浮現的就是redis了,為什麼redis能夠在競爭激烈的緩存大戰中脫穎而出呢?原因無非有一下幾點:性能好,豐富的特性跟數據結構,api操作簡單。但是用的人多了,就會出現很多不規範或者疏忽的地方,嚴重的時候甚至會導致生產事故,所以我們有必要來聊聊在Redis使用過 ...
  • 本文將介紹如何使用Docker Compose搭建Istio。Istio號稱支持多種平臺(不僅僅Kubernetes)。然而,官網上非基於Kubernetes的教程仿佛不是親兒子,寫得非常隨便,不僅缺了一些內容,而且還有坑。本文希望能補實這些內容。我認為在學習Istio的過程中,相比於Kuberne ...
  • 前言 如今不管是在面試還是在我們的工作中,OOM總是不斷的出現在我們的視野中,所以我們有必要去瞭解一下導致OOM的原因以及一些基本的調整方法,大家可以通過下麵的事例來瞭解一下什麼樣的代碼會導致OOM,幫助我們以後在工作中能夠通過異常信息來判斷是JVM裡面哪個區域出現了問題。 先介紹一下筆者的相關編碼 ...
  • 前幾天棧長分享了一個好玩的框架: "一個比Spring Boot快44倍的Java框架!" ,是不是感覺 Spring Boot 略慢?今天講一下 Spring Boot 添加的這個新特性,可以大大提升 Spring Boot 的啟動速度。 最近,Spring團隊宣佈在 Spring Boot 2. ...
  • ~~暫時空白....~~ 沒有前置,我用vector存圖 cpp //存儲 struct edge{ int w,to;//w是權值,to是連接到的下一條邊 }; vector e; //連邊 ... for(int i=1;i ...
  • SpringMVC跨域問題排查以及源碼實現 最近一次項目中,將SpringMVC版本從4.1.1升級到4.3.10,出現跨域失敗的情況。關於同源策略和跨域解決方案,網上有很多資料。 項目採用的方式是通過實現過濾器Filter,在Response返回頭文件添加跨域資源共用(CORS) 相關的參數。 發 ...
  • 1.可以把七層協議簡化成四層協議鏈路層 網路層 傳輸層 應用層 2.通過路由器連接的兩個網路網路層ip提供的是一個逐跳協議,提供了一種不可靠的服務,中間有可能會丟傳輸層tcp在ip的基礎上提供了可靠的傳輸層 比喻:tcp就是淘寶賣家 ,ip就是包裹,中間如果包裹丟了,賣家會重新發一個包裹,這裡會有一 ...
  • 鏈表:由一系列不必再記憶體中相連的結構組成,每一個結構均含有表元素和指向後繼結構的指針。 與數組、列表的主要區別: 記憶體不連續; 不能通過下標隨機訪問。 優點: 插入、刪除操作效率高,時間複雜度為o(1); 記憶體利用率高,不會浪費記憶體; 大小不固定,擴展靈活; 缺點: 隨機訪問性差,查找效率低,時間復 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...