Java集合框架1-- HashMap

来源:https://www.cnblogs.com/EthanWong/archive/2020/07/21/13357910.html
-Advertisement-
Play Games

HashMap的知識點可以說在面試中經常被問到,是Java中比較常見的一種數據結構。所以這一篇就通過源碼來深入理解下HashMap。 1 HashMap的底層是如何實現的?(基於JDK8) 1.1 HashMap的類結構和成員 /** HashMap繼承AbstractMap,而AbstractMa ...


HashMap的知識點可以說在面試中經常被問到,是Java中比較常見的一種數據結構。所以這一篇就通過源碼來深入理解下HashMap。

1 HashMap的底層是如何實現的?(基於JDK8)

1.1 HashMap的類結構和成員

/**
HashMap繼承AbstractMap,而AbstractMap又實現了Map的介面
*/ 
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable 
    

從上面源碼可以看出HashMap支持序列化和反序列化,而且實現了cloneable介面,能支持clone()方法複製一個對象。

1.1.1 HashMap源碼中的幾個成員屬性

//最小容量為16,且一定是2的冪次
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

 //最大容量為2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;

// 預設載入因數
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//當某節點的鏈表長度大於8並且hash數組的容量達到64時,鏈表將會轉換成紅黑樹
static final int TREEIFY_THRESHOLD = 8;

//當鏈表長度小於6時,紅黑樹將轉換成鏈表
static final int UNTREEIFY_THRESHOLD = 6;

//鏈表變成紅黑樹的最小容量
static final int MIN_TREEIFY_CAPACITY = 64;

從上面的源碼可以看出,JDK1.8的HashMap實際上是由數組+鏈表+紅黑樹組成,在一定條件下鏈表會轉換成紅黑樹。這裡要談一下預設載入因數為什麼為0.75(3/4),載入因數也叫擴容因數,用來判斷HashMap什麼時候進行擴容。選擇0.75的原因是為了平衡容量與查找性能:擴容因數越大,造成hash衝突的幾率就越大,查找性能就會越低,反之擴容因數越小,所占容量就會越大。於此同時,負載因數為3/4的話,和capacity的乘積結果就可以是一個整數。

下麵再看看hash數組中的元素

1.1.2 HashMap中的數組節點

​ hash數組一般稱為哈希桶(bucket),結點在JDK1.7中叫Entry,在JDK1.8中叫Node。

//1.8中Node實現entry的介面
static class Node<K,V> implements Map.Entry<K,V> {
    //每個節點都會包含四個欄位:hash、key、value、next
        final int hash;
        final K key;
        V value;
        Node<K,V> next;//指向下一個節點

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }
    
		//hash值是由key和value的hashcode異或得到
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            //判斷o對象是否為Map.Entry的實例
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                //再判斷兩者的key和value值是否相同
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
}
//這個是擾動函數,減少hash碰撞
static final int hash(Object key) {
        int h;
    	//將key的高16位與低16位異或(int是2個位元組,32位)
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

1.2 HashMap中的方法

1.2.1 查詢方法

public V get(Object key) {
        Node<K,V> e;
    	//將key值擾動後傳入getNode函數查詢節點
        return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    	//判斷哈希表是否為空,第一個節點是否為空
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            //從第一個節點開始查詢,如果hash值和key值相等,則查詢成功,返回該節點
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            //查詢下一個節點
            if ((e = first.next) != null) {
                //若該節點存在紅黑樹,則從紅黑樹中查找節點
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                //若該節點存在鏈表,循著鏈表查找節點
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
}

1.2.2 新增方法

向哈希表中插入一個節點

public V put(K key, V value) {
    	//將擾動的hash值傳入,調用putVal函數
        return putVal(hash(key), key, value, false, true);
    }
//當參數onlyIfAbsent為true時,不會覆蓋相同key的值value;當evict是false時,表示是在初始化時調用
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    //若哈希表為空,直接對哈希表進行擴容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //若當前節點為空,則直接在該處新建節點
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {//若當前節點非空,則說明發生哈希碰撞,再考慮是鏈表或者紅黑樹
        Node<K,V> e; K k;
        //如果與該節點的hash值和key值都相等,將節點引用賦給e
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        //如果p是樹節點的實例,調用紅黑樹方法新增一個樹節點e
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        //若該節點後是鏈表
        else {
            for (int binCount = 0; ; ++binCount) {
                //遍歷到鏈表末尾插入新節點
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    //若插入節點後,鏈表節點數大於轉變成紅黑樹的臨界值(>=8)
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        //將鏈表轉換成紅黑樹
                        treeifyBin(tab, hash);
                    break;
                }
                //遍歷過程中發現了key和hash值相同的節點,用e覆蓋該節點
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        //對e節點進行處理
        if (e != null) { 
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    //節點插入成功,修改modCount值
    ++modCount;
    //如果達到擴容條件,直接擴容
    if (++size > threshold)
        resize();
    
    afterNodeInsertion(evict);
    return null;
}

1.2.3 擴容方法(非常重要)

final Node<K,V>[] resize() {
    //當前的數組
    Node<K,V>[] oldTab = table;
    //當前的數組大小和閾值
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    //對新數組大小和閾值初始化
    int newCap, newThr = 0;
    //若當前數組非空
    if (oldCap > 0) {
        //若當前數組超過容量最大值,返回原數組不擴容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //若當前數組低於閾值,直接在數組容量範圍內擴大兩倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    //數組為空,且大於最小容量(數組初始化過)
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    //數組為空,且沒有初始化
    else {               // zero initial threshold signifies using defaults
        //初始化數組
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //數組為空,且新的閾值為0
    if (newThr == 0) {
        //求出新的閾值(新數組容量*載入因數)
        float ft = (float)newCap * loadFactor;
        //判斷新閾值是否越界,並做相應的賦值
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    //閾值更新
    threshold = newThr;
    
    @SuppressWarnings({"rawtypes","unchecked"})
    //構建新的數組並賦值
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    //若之前數組非空,將數據複製到新數組中
    if (oldTab != null) {
        //迴圈之前數組,將非空元素複製到新數組中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                //若迴圈到該節點是最後一個非空節點,直接賦值
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                //若發現該節點是樹節點
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                //若該節點後是鏈表
                else { // preserve order
                    //定義現有數組的位置low,擴容後的位置high;high = low + oldCap
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        /*通過(e.hash & oldCap)來確定元素是否需要移動,
                          e.hash & oldCap大於0,說明位置需要作相應的調整。
                          反之等於0時說明在該容量範圍內,下標位置不變。
                        */
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    //低位下標位置不變
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    //處於高位位置要改變為j + oldCap
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

​ HashMap實際上是線程不安全的,在JDK1.7中,鏈表的插入方式為頭插法,在多線程下插入可能會導致死迴圈。因此在JDK1.8中替換成尾插法(其實想要線程安全大可用ConcurrentHashMap、Hashtable)

//JDK1.7源碼
void transfer(Entry[] newTable boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            //多線程在這裡會導致指向成環
            Entry<K,V> next = e.next;
            if(rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, new Capacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

假如HashMap的容量為2,其中在數組中有一個元素a(此時已經到達擴容的臨界點)。創建兩個線程t1、t2分別插入b、c,因為沒有鎖,兩個線程都進行到擴容這一步,那麼其中有節點位子因為擴容必然會發生變化(以前的容量不夠),這個時候假設t1線程成功運行,插入成功。但是由於t2線程的合併,加上節點位置的挪動,就會造成鏈表成環。最後讀取失敗

1.2.4 刪除方法

//通過key值刪除該節點,並返回value
public V remove(Object key) {
    Node<K,V> e;
    return (e = removeNode(hash(key), key, null, false, true)) == null ? null : e.value;
}
//刪除某個節點
//若matchValue為true時,需要key和value都要相等才能刪除;若movable為false時,刪除節點時不移動其他節點
final Node<K,V> removeNode(int hash, Object key, Object value,boolean matchValue, boolean movable) {
    Node<K,V>[] tab; Node<K,V> p; int n, index;
    //若數組非空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (p = tab[index = (n - 1) & hash]) != null) {
        //設node為刪除點
        Node<K,V> node = null, e; K k; V v;
        //查到頭節點為所要刪除的點,直接賦於node
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            node = p;
        //否則遍歷
        else if ((e = p.next) != null) {
            //當節點為樹節點
            if (p instanceof TreeNode)
                node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
            //節點為鏈表時
            else {
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key ||
                         (key != null && key.equals(k)))) {
                        node = e;
                        break;
                    }
                    p = e;
                } while ((e = e.next) != null);
            }
        }
        //對取回的node節點進行處理,當matchValue為false,或者value相等時
        if (node != null && (!matchValue || (v = node.value) == value ||
                     (value != null && value.equals(v)))) {
            if (node instanceof TreeNode) //為樹節點
                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
            else if (node == p) //為鏈表頭結點
                tab[index] = node.next;
            else //為鏈表中部節點
                p.next = node.next;
            //修改modCount和size
            ++modCount;
            --size;
            afterNodeRemoval(node);
            return node;
        }
    }
    return null;
}

2.一些面試題

2.1 JDK1.8 HashMap擴容時做了哪些優化

  1. 新元素下標方面,1.8通過高位運算(e.hash & oldCap) == 0分類處理表中的元素:低位不變,高位原下標+原數組長度;而不是像1.7中計算每一個元素下標。

  2. 在resize()函數中,1.8將1.7中的頭插逆序變成尾插順序。但是仍然建議在多線程下不要用HashMap。

2.2 HashMap與Hashtable的區別

  1. 線程安全:Hashtable是線程安全的,不允許key,value為null。
  2. 繼承父類:Hashtable是Dictionary類的子類(Dictionary類已經被廢棄),兩者都實現了Map介面。
  3. 擴容:Hashtable預設容量為11,擴容為原來的容量2倍+1,所以Hashtable獲取下標直接用模運算符%。
  4. 存儲方式:Hashtable中出現衝突後,只有用鏈表方式存儲。

2.3 HashMap線程不安全,那麼有哪些Map可以實現線程安全

  1. Hashtable: 直接在方法上加synchronized關鍵字,鎖住整個哈希桶
  2. ConcurrentHashMap:使用分段鎖,相比於Hashtable性能更高
  3. Collectons.synchronizedMap:是使用Collections集合工具的內部類,通過傳入Map封裝一個SynchronizedMap對象,內部定義一個對象鎖,方法通過對象鎖實現。

參考博文:

HashMap 底層實現原理是什麼?JDK8 做了哪些優化?

一個HashMap跟面試官扯了半個小時


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 移動端重置樣式 1、禁止用戶選中文字,安卓無效 ­webkit­user­select: none; 2、禁止長按彈出系統菜單。 ­webkit­touch­callout: none; 3、去除android下a/button/input標簽被點擊時產生的邊框 & 去除ios下a標簽被點擊時產生的 ...
  • 1. number, string, boolean(聲明方式加不加new的區別) var a = number( 1 ) 返回數字 1 var b = string( false ) 返回字元串 'false' var c = boolean( 1) 返回布爾值 true (5個false值: 0 ...
  • 本篇文章收錄於專輯:http://dwz.win/HjK 前言 你好,我是彤哥,一個每天爬二十六層樓還不忘讀源碼的硬核男人。 上一節,我們從事後統計法過渡到漸近分析法,詳細講解瞭如何進行演算法的複雜度分析。 但是,如果遵循嚴格的漸近分析法,需要掌握大量數學知識,這無疑給我們評估演算法的優劣帶來了很大的挑 ...
  • 活動背景 2020年,大數據成為國家基建的一個重要組成,大數據在越來越多的領域展現威力。隨著大數據的應用場景越來越多,大家對數據的響應速度和數據加工工作流的方便程度也提出了更高的要求。在這種背景下,相信做過大數據的技術小伙伴應該對 Apache 一詞不會陌生,Apache 基金會旗下擁有被廣泛使用的 ...
  • 一、Connection介面 該介面代表Java程式和數據的連接,只有獲取該連接對象,才能訪問資料庫來操作數據表 常用方法: 方法 說明 creatStatement() 創建並返回一個Statement實例,通常在執行無參數SQL語句時創建該實例 prepareStatement() 創建並返回一 ...
  • 介面預設方法 在介面中的方法前加上default關鍵字就可以在介面中寫方法的預設實現。 預設方法,介面的子類不需要實現,可以直接使用 可以定義一個或多個預設方法 以List介面為例,在Java8中新增了預設方法: public interface List<E> extends Collection ...
  • Stream API 使用一種類似於SQL語句從資料庫查詢數據的直觀方式對Java集合進行運算和表達。 將要處理的元素集合看作一種流, 流在管道中傳輸,我們可以在管道的節點上進行處理, 比如篩選, 排序,聚合等。 Stream的三個操作步驟為: 創建Stream:從一個數據源,如集合、數組中獲取流。 ...
  • 一:什麼是動態代理: 利用反射機制在運行時創建代理類。介面、被代理類不變。 二:動態代理和靜態代理的不同: 1、靜態代理的代理類是程式員事先寫好的 2、動態代理的代理類是在程式運行時動態生成的 三:動態代理分為兩大類: 1、基於介面的動態代理 2、基於類的動態代理 四:動態代理的三種實現方式: 1、 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...