死磕 java集合之ArrayList源碼分析

来源:https://www.cnblogs.com/tong-yuan/archive/2019/04/01/10638855.html
-Advertisement-
Play Games

見過的最詳細的ArrayList的源碼分析了,分析得很透徹。比如,c.toArray()一定返回Object[]類型嗎?elementData聲明為transient,那它到底是怎麼序列化的呢?遠遠不止這些…… ...


歡迎關註我的公眾號“彤哥讀源碼”,查看更多源碼系列文章, 與彤哥一起暢游源碼的海洋。

簡介

ArrayList是一種以數組實現的List,與數組相比,它具有動態擴展的能力,因此也可稱之為動態數組。

繼承體系

ArrayList

ArrayList實現了List, RandomAccess, Cloneable, java.io.Serializable等介面。

ArrayList實現了List,提供了基礎的添加、刪除、遍歷等操作。

ArrayList實現了RandomAccess,提供了隨機訪問的能力。

ArrayList實現了Cloneable,可以被克隆。

ArrayList實現了Serializable,可以被序列化。

源碼解析

屬性

/**
 * 預設容量
 */
private static final int DEFAULT_CAPACITY = 10;

/**
 * 空數組,如果傳入的容量為0時使用
 */
private static final Object[] EMPTY_ELEMENTDATA = {};

/**
 * 空數組,傳傳入容量時使用,添加第一個元素的時候會重新初始為預設容量大小
 */
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

/**
 * 存儲元素的數組
 */
transient Object[] elementData; // non-private to simplify nested class access

/**
 * 集合中元素的個數
 */
private int size;

(1)DEFAULT_CAPACITY

預設容量為10,也就是通過new ArrayList()創建時的預設容量。

(2)EMPTY_ELEMENTDATA

空的數組,這種是通過new ArrayList(0)創建時用的是這個空數組。

(3)DEFAULTCAPACITY_EMPTY_ELEMENTDATA

也是空數組,這種是通過new ArrayList()創建時用的是這個空數組,與EMPTY_ELEMENTDATA的區別是在添加第一個元素時使用這個空數組的會初始化為DEFAULT_CAPACITY(10)個元素。

(4)elementData

真正存放元素的地方,使用transient是為了不序列化這個欄位。

至於沒有使用private修飾,後面註釋是寫的“為了簡化嵌套類的訪問”,但是樓主實測加了private嵌套類一樣可以訪問。

private表示是類私有的屬性,只要是在這個類內部都可以訪問,嵌套類或者內部類也是在類的內部,所以也可以訪問類的私有成員。

(5)size

真正存儲元素的個數,而不是elementData數組的長度。

ArrayList(int initialCapacity)構造方法

傳入初始容量,如果大於0就初始化elementData為對應大小,如果等於0就使用EMPTY_ELEMENTDATA空數組,如果小於0拋出異常。

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        // 如果傳入的初始容量大於0,就新建一個數組存儲元素
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        // 如果傳入的初始容量等於0,使用空數組EMPTY_ELEMENTDATA
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        // 如果傳入的初始容量小於0,拋出異常
        throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);
    }
}

ArrayList()構造方法

不傳初始容量,初始化為DEFAULTCAPACITY_EMPTY_ELEMENTDATA空數組,會在添加第一個元素的時候擴容為預設的大小,即10。

public ArrayList() {
    // 如果沒有傳入初始容量,則使用空數組DEFAULTCAPACITY_EMPTY_ELEMENTDATA
    // 使用這個數組是在添加第一個元素的時候會擴容到預設大小10
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

ArrayList(Collection<? extends E> c)構造方法

傳入集合併初始化elementData,這裡會使用拷貝把傳入集合的元素拷貝到elementData數組中,如果元素個數為0,則初始化為EMPTY_ELEMENTDATA空數組。

/**
* 把傳入集合的元素初始化到ArrayList中
*/
public ArrayList(Collection<? extends E> c) {
    // 集合轉數組
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // 檢查c.toArray()返回的是不是Object[]類型,如果不是,重新拷貝成Object[].class類型
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // 如果c的空集合,則初始化為空數組EMPTY_ELEMENTDATA
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

為什麼c.toArray();返回的有可能不是Object[]類型呢?請看下麵的代碼:

public class ArrayTest {
    public static void main(String[] args) {
        Father[] fathers = new Son[]{};
        // 列印結果為class [Lcom.coolcoding.code.Son;
        System.out.println(fathers.getClass());

        List<String> strList = new MyList();
        // 列印結果為class [Ljava.lang.String;
        System.out.println(strList.toArray().getClass());
    }
}

class Father {}

class Son extends Father {}

class MyList extends ArrayList<String> {
    /**
     * 子類重寫父類的方法,返回值可以不一樣
     * 但這裡只能用數組類型,換成Object就不行
     * 應該算是java本身的bug
     */
    @Override
    public String[] toArray() {
        // 為了方便舉例直接寫死
        return new String[]{"1", "2", "3"};
    }
}

add(E e)方法

添加元素到末尾,平均時間複雜度為O(1)。

public boolean add(E e) {
    // 檢查是否需要擴容
    ensureCapacityInternal(size + 1);
    // 把元素插入到最後一位
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
    // 如果是空數組DEFAULTCAPACITY_EMPTY_ELEMENTDATA,就初始化為預設大小10
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    if (minCapacity - elementData.length > 0)
        // 擴容
        grow(minCapacity);
}

private void grow(int minCapacity) {
    int oldCapacity = elementData.length;
    // 新容量為舊容量的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 如果新容量發現比需要的容量還小,則以需要的容量為準
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 如果新容量已經超過最大容量了,則使用最大容量
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 以新容量拷貝出來一個新數組
    elementData = Arrays.copyOf(elementData, newCapacity);
}

(1)檢查是否需要擴容;

(2)如果elementData等於DEFAULTCAPACITY_EMPTY_ELEMENTDATA則初始化容量大小為DEFAULT_CAPACITY;

(3)新容量是老容量的1.5倍(oldCapacity + (oldCapacity >> 1)),如果加了這麼多容量發現比需要的容量還小,則以需要的容量為準;

(4)創建新容量的數組並把老數組拷貝到新數組;

add(int index, E element)方法

添加元素到指定位置,平均時間複雜度為O(n)。

public void add(int index, E element) {
    // 檢查是否越界
    rangeCheckForAdd(index);
    // 檢查是否需要擴容
    ensureCapacityInternal(size + 1);
    // 將inex及其之後的元素往後挪一位,則index位置處就空出來了
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    // 將元素插入到index的位置
    elementData[index] = element;
    // 大小增1
    size++;
}

private void rangeCheckForAdd(int index) {
    if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

(1)檢查索引是否越界;

(2)檢查是否需要擴容;

(3)把插入索引位置後的元素都往後挪一位;

(4)在插入索引位置放置插入的元素;

(5)大小加1;

addAll(Collection<? extends E> c)方法

求兩個集合的並集。

/**
* 將集合c中所有元素添加到當前ArrayList中
*/
public boolean addAll(Collection<? extends E> c) {
    // 將集合c轉為數組
    Object[] a = c.toArray();
    int numNew = a.length;
    // 檢查是否需要擴容
    ensureCapacityInternal(size + numNew);
    // 將c中元素全部拷貝到數組的最後
    System.arraycopy(a, 0, elementData, size, numNew);
    // 大小增加c的大小
    size += numNew;
    // 如果c不為空就返回true,否則返回false
    return numNew != 0;
}

(1)拷貝c中的元素到數組a中;

(2)檢查是否需要擴容;

(3)把數組a中的元素拷貝到elementData的尾部;

get(int index)方法

獲取指定索引位置的元素,時間複雜度為O(1)。

public E get(int index) {
    // 檢查是否越界
    rangeCheck(index);
    // 返回數組index位置的元素
    return elementData(index);
}

private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

E elementData(int index) {
    return (E) elementData[index];
}

(1)檢查索引是否越界,這裡只檢查是否越上界,如果越上界拋出IndexOutOfBoundsException異常,如果越下界拋出的是ArrayIndexOutOfBoundsException異常。

(2)返回索引位置處的元素;

remove(int index)方法

刪除指定索引位置的元素,時間複雜度為O(n)。

public E remove(int index) {
    // 檢查是否越界
    rangeCheck(index);

    modCount++;
    // 獲取index位置的元素
    E oldValue = elementData(index);
    
    // 如果index不是最後一位,則將index之後的元素往前挪一位
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    
    // 將最後一個元素刪除,幫助GC
    elementData[--size] = null; // clear to let GC do its work

    // 返回舊值
    return oldValue;
}

(1)檢查索引是否越界;

(2)獲取指定索引位置的元素;

(3)如果刪除的不是最後一位,則其它元素往前移一位;

(4)將最後一位置為null,方便GC回收;

(5)返回刪除的元素。

可以看到,ArrayList刪除元素的時候並沒有縮容。

remove(Object o)方法

刪除指定元素值的元素,時間複雜度為O(n)。

public boolean remove(Object o) {
    if (o == null) {
        // 遍歷整個數組,找到元素第一次出現的位置,並將其快速刪除
        for (int index = 0; index < size; index++)
            // 如果要刪除的元素為null,則以null進行比較,使用==
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        // 遍歷整個數組,找到元素第一次出現的位置,並將其快速刪除
        for (int index = 0; index < size; index++)
            // 如果要刪除的元素不為null,則進行比較,使用equals()方法
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

private void fastRemove(int index) {
    // 少了一個越界的檢查
    modCount++;
    // 如果index不是最後一位,則將index之後的元素往前挪一位
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    // 將最後一個元素刪除,幫助GC
    elementData[--size] = null; // clear to let GC do its work
}

(1)找到第一個等於指定元素值的元素;

(2)快速刪除;

fastRemove(int index)相對於remove(int index)少了檢查索引越界的操作,可見jdk將性能優化到極致。

retainAll(Collection<?> c)方法

求兩個集合的交集。

public boolean retainAll(Collection<?> c) {
    // 集合c不能為null
    Objects.requireNonNull(c);
    // 調用批量刪除方法,這時complement傳入true,表示刪除不包含在c中的元素
    return batchRemove(c, true);
}

/**
* 批量刪除元素
* complement為true表示刪除c中不包含的元素
* complement為false表示刪除c中包含的元素
*/
private boolean batchRemove(Collection<?> c, boolean complement) {
    final Object[] elementData = this.elementData;
    // 使用讀寫兩個指針同時遍曆數組
    // 讀指針每次自增1,寫指針放入元素的時候才加1
    // 這樣不需要額外的空間,只需要在原有的數組上操作就可以了
    int r = 0, w = 0;
    boolean modified = false;
    try {
        // 遍歷整個數組,如果c中包含該元素,則把該元素放到寫指針的位置(以complement為準)
        for (; r < size; r++)
            if (c.contains(elementData[r]) == complement)
                elementData[w++] = elementData[r];
    } finally {
        // 正常來說r最後是等於size的,除非c.contains()拋出了異常
        if (r != size) {
            // 如果c.contains()拋出了異常,則把未讀的元素都拷貝到寫指針之後
            System.arraycopy(elementData, r,
                             elementData, w,
                             size - r);
            w += size - r;
        }
        if (w != size) {
            // 將寫指針之後的元素置為空,幫助GC
            for (int i = w; i < size; i++)
                elementData[i] = null;
            modCount += size - w;
            // 新大小等於寫指針的位置(因為每寫一次寫指針就加1,所以新大小正好等於寫指針的位置)
            size = w;
            modified = true;
        }
    }
    // 有修改返回true
    return modified;
}

(1)遍歷elementData數組;

(2)如果元素在c中,則把這個元素添加到elementData數組的w位置並將w位置往後移一位;

(3)遍歷完之後,w之前的元素都是兩者共有的,w之後(包含)的元素不是兩者共有的;

(4)將w之後(包含)的元素置為null,方便GC回收;

removeAll(Collection<?> c)

求兩個集合的單方向差集,只保留當前集合中不在c中的元素,不保留在c中不在當前集體中的元素。

public boolean removeAll(Collection<?> c) {
    // 集合c不能為空
    Objects.requireNonNull(c);
    // 同樣調用批量刪除方法,這時complement傳入false,表示刪除包含在c中的元素
    return batchRemove(c, false);
}

與retainAll(Collection<?> c)方法類似,只是這裡保留的是不在c中的元素。

總結

(1)ArrayList內部使用數組存儲元素,當數組長度不夠時進行擴容,每次加一半的空間,ArrayList不會進行縮容;

(2)ArrayList支持隨機訪問,通過索引訪問元素極快,時間複雜度為O(1);

(3)ArrayList添加元素到尾部極快,平均時間複雜度為O(1);

(4)ArrayList添加元素到中間比較慢,因為要搬移元素,平均時間複雜度為O(n);

(5)ArrayList從尾部刪除元素極快,時間複雜度為O(1);

(6)ArrayList從中間刪除元素比較慢,因為要搬移元素,平均時間複雜度為O(n);

(7)ArrayList支持求並集,調用addAll(Collection<? extends E> c)方法即可;

(8)ArrayList支持求交集,調用retainAll(Collection<? extends E> c)方法即可;

(7)ArrayList支持求單向差集,調用removeAll(Collection<? extends E> c)方法即可;

彩蛋

elementData設置成了transient,那ArrayList是怎麼把元素序列化的呢?

private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException{
    // 防止序列化期間有修改
    int expectedModCount = modCount;
    // 寫出非transient非static屬性(會寫出size屬性)
    s.defaultWriteObject();

    // 寫出元素個數
    s.writeInt(size);

    // 依次寫出元素
    for (int i=0; i<size; i++) {
        s.writeObject(elementData[i]);
    }

    // 如果有修改,拋出異常
    if (modCount != expectedModCount) {
        throw new ConcurrentModificationException();
    }
}

private void readObject(java.io.ObjectInputStream s)
        throws java.io.IOException, ClassNotFoundException {
    // 聲明為空數組
    elementData = EMPTY_ELEMENTDATA;

    // 讀入非transient非static屬性(會讀取size屬性)
    s.defaultReadObject();

    // 讀入元素個數,沒什麼用,只是因為寫出的時候寫了size屬性,讀的時候也要按順序來讀
    s.readInt();

    if (size > 0) {
        // 計算容量
        int capacity = calculateCapacity(elementData, size);
        SharedSecrets.getJavaOISAccess().checkArray(s, Object[].class, capacity);
        // 檢查是否需要擴容
        ensureCapacityInternal(size);
        
        Object[] a = elementData;
        // 依次讀取元素到數組中
        for (int i=0; i<size; i++) {
            a[i] = s.readObject();
        }
    }
}

查看writeObject()方法可知,先調用s.defaultWriteObject()方法,再把size寫入到流中,再把元素一個一個的寫入到流中。

一般地,只要實現了Serializable介面即可自動序列化,writeObject()和readObject()是為了自己控制序列化的方式,這兩個方法必須聲明為private,在java.io.ObjectStreamClass#getPrivateMethod()方法中通過反射獲取到writeObject()這個方法。

在ArrayList的writeObject()方法中先調用了s.defaultWriteObject()方法,這個方法是寫入非static非transient的屬性,在ArrayList中也就是size屬性。同樣地,在readObject()方法中先調用了s.defaultReadObject()方法解析出了size屬性。

elementData定義為transient的優勢,自己根據size序列化真實的元素,而不是根據數組的長度序列化元素,減少了空間占用。


歡迎關註我的公眾號“彤哥讀源碼”,查看更多源碼系列文章, 與彤哥一起暢游源碼的海洋。

qrcode


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.JVM運行時數據區 (1)程式計數器:線程私有,可以看做是當前線程所執行的位元組碼的行號指示器。選取下一條位元組碼指令、分支、線程恢復等都需要程式計數器來完成。 (2)虛擬機棧:同樣是線程私有,它描述的是java方法執行的記憶體模型:每個方法在執行的同時,都會創建一個棧幀,用來存放局部變數表、操作數棧 ...
  • 死磕 java集合之LinkedHashMap源碼分析 你瞭解它的存儲結構嗎? 你知道它為什麼可以用來實現LRU緩存嗎? 它真的可以直接拿來實現LRU緩存嗎? ...
  • 通常GC採用有向圖的方式記錄和管理堆區中的所有對象 JVM將堆記憶體劃分為 Eden、Survivor 和 Tenured/Old 空間。 1. 年輕代 所有新生成的對象首先都是放在Eden區。 年輕代的目標就是儘可能快速的收集掉那些生命周期短的對象,對應的是Minor GC,每次 Minor GC ...
  • 用鏈表實現棧一開始在表頭插入,就要一直在表頭插入一開始在表尾插入,就要一直在表頭插尾表頭當棧底 也可以把表尾當棧底 實現的測試代碼筆記如下: 附: 推箱子實現,代碼筆記如下所示: 最後實現效果如下所示; 2019-04-01 21:33:15 ...
  • ●使用PHP+MySQL實現修改密碼 頁面: index.php 登陸頁面,輸入預設密碼登陸系統 check.php 核查頁面,通過查詢資料庫檢測密碼是否正確 ——> 正確,則進入系統 或 錯誤,提示“密碼錯誤”,返回登錄頁面 system.php 系統頁面,內含“修改密碼”鏈接 change.ph ...
  • Leetcode(2) 記:這幾天內心十分焦慮,研究生的日子一天天過去,感覺毫無收穫,每天刷個題來壓壓驚. 2.Add Two Number · 錯誤示例 · 思路 寫兩個函數將一個數從List轉化為int, 相加後再從int轉化為List返回. · 偽代碼: 1.構造兩個函數分別代表: 一個數字從 ...
  • ssm客戶管理系統 註意:本文是在我的上一篇文章 https://www.cnblogs.com/peter-hao/p/ssm.html的基礎上開發 1 需求 1.1 添加客戶 客戶填寫信息,提交,將信息保存到資料庫中。 1.2 刪除客戶 在每條查詢出來的客戶信息設置刪除操作,點擊即可刪除。更新數 ...
  • /** * 給定一個字元串,統計每個字元出現的次數。 如:abdaewrwqask435a1aasd */public class ReplaceString { static int length; public static void countString(String s) { while ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...