Android數據結構-SparseArray實現原理

来源:https://www.cnblogs.com/lixuejian/archive/2023/03/21/17241463.html
-Advertisement-
Play Games

SparseArray家族 SparseArray基於鍵值對存儲數據,key為int,value為object,簡單使用如下: //聲明 SparseArray<String> sparseArray= new SparseArray<>(); //增加元素,append方式 sparseArray ...


SparseArray家族

SparseArray基於鍵值對存儲數據,key為int,value為object,簡單使用如下:

        //聲明
        SparseArray<String> sparseArray= new SparseArray<>();
        //增加元素,append方式
        sparseArray.append(0, "myValue");
        //增加元素,put方式
        sparseArray.put(1, "myValue");
        //刪除元素,二者等同
        sparseArray.remove(1);
        sparseArray.delete(1);
        //修改元素,put或者append相同的key值即可
        sparseArray.put(1,"newValue");
        sparseArray.append(1,"newValue");
        //查找,遍歷方式1
        for(int i=0;i<sparseArray.size();i++){
            Log.d(TAG,sparseArray.valueAt(i));
        }
        //查找,遍歷方式2
        for(int i=0;i<sparseArray.size();i++){
            int key = sparseArray.keyAt(i);
            Log.d(TAG,sparseArray.get(key));
        }

LongSparseArray 和SparseArray 相比,唯一的不同就是key值為long,所以LongSparseArray可以存儲的數據元素就比SparseArray多,int的範圍是-2^31 到 231-1,而long是-263 到 2^63-1。

SparseBooleanArray,SparseIntArray,SparseLongArray,這三個數據結構的key值的類型也是int,value值的類型也固定,SparseBooleanArray的value固定為boolean類型,SparseIntArray的value固定為int類型,SparseLongArray的value固定為long類型。

總結一下這四種數據結構的key,value類型:

SparseArray          <int, Object>
LongSparseArray      <long, Object>
SparseBooleanArray   <int, boolean>
SparseIntArray       <int, int>
SparseLongArray      <int, long>

上述四種數據結構的key類型都是int,而不是Integer,相較於使用HashMap的話,省去了裝箱拆箱過程,查詢、存儲等操作效率更高,而且int的存儲開銷也遠小於Integer。

SparseArray實現原理

SparseArray內部的重要屬性:

public class SparseArray<E> implements Cloneable {
    private static final Object DELETED = new Object();
    private boolean mGarbage = false;
    private int[] mKeys;
    private Object[] mValues;
    private int mSize;
}

DELETED

static final 的一個靜態Object實例,當一個鍵值對被remove後,會在對應key的value下放置該對象,標記該元素已經被刪除,只是標記刪除,沒有真正的刪除。

mGarbage

當值為true,標誌數據結構中有元素被刪除,可以觸發gc對無效數據進行回收,真正刪除。

mKeys

用於存放Key的數組,通過int[] 進行存儲,與HashMap相比減少了裝箱拆箱的操作,同時一個int只占4位元組;一個重要特點,mKeys的元素是升序排列的,也是基於此,我們才能使用二分查找。

mValues

用於存放與Key對應的Value,通過數組的position 進行映射;如果存放的是int型等,可以用SparseIntArray ,存放的Values也是int數組,性能更高。

mSize

mSize的大小等於數組中mValues的值等於非DELETED的元素個數。

remove方法源碼:

    public void delete(int key) {
        //查找對應key在數組中的下標,如果存在,返回下標,不存在,返回下標的取反;
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
        //key存在於mKeys數組中,將元素刪除,用DELETED替換原value,起標記作用;
        if (i >= 0) {
            if (mValues[i] != DELETED) {
                mValues[i] = DELETED;
                mGarbage = true;
            }
        }
    }
     
    /**
     * @hide
     * Removes the mapping from the specified key, if there was any, returning the old value.
     */
    public E removeReturnOld(int key) {
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
     
        if (i >= 0) {
            if (mValues[i] != DELETED) {
                final E old = (E) mValues[i];
                mValues[i] = DELETED;
                mGarbage = true;
                return old;
            }
        }
        return null;
    }
     
    /**
     * Alias for {@link #delete(int)}.
     */
    public void remove(int key) {
        delete(key);
    }

二分查找:

class ContainerHelpers {

    // This is Arrays.binarySearch(), but doesn't do any argument validation.
    //第一個參數array為keys的數組,第二個為數組中元素個數(與keys的length不一定相等),第三個value為目標的key
    static int binarySearch(int[] array, int size, int value) {
        //lo為二分查找的左邊界
        int lo = 0;
        //hi為二分查找的右邊界
        int hi = size - 1;
        //還沒找到,繼續查找
        while (lo <= hi) {
            //左邊界+右邊界處以2,獲取到mid 的index
            final int mid = (lo + hi) >>> 1;
            //獲取中間元素
            final int midVal = array[mid];
            // 目標key在右部分  。。。。感覺這部分太簡單了
            if (midVal < value) {
                lo = mid + 1;
            } else if (midVal > value) {
                hi = mid - 1;
            } else {
                //相等,找到了,返回key對應在array的下標;
                return mid;  // value found
            }
        }
        //沒有找到該元素,對lo取反!!!!!很重要
        return ~lo;  // value not present
    }

該方法是通過二分查找返回了當前key的對應於mKeys數組的下標,如果沒有找到,就返回一個特殊的負數。二分法返回的數值如果非負數,我們則對其所對應的value進行替換成DELETED,用於標記該key已經被刪除,但是key仍然存在於mKeys數組,因此刪除是一個偽刪除同時,我們將garbage賦值true,代表數組中可能存在垃圾。

put方法源碼:

    public void put(int key, E value) {
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
        //原來已經有key,可能是remove後,value存放著DELETED,也可能是存放舊值,那麼就替換
        if (i >= 0) {
            mValues[i] = value;
        } else {
            //沒有找到,對i取反,得到i= lo(ContainerHelpers.binarySearch)
            i = ~i;
            //如果i小於數組長度,且mValues==DELETED(i對應的Key被延遲刪除了)
            if (i < mSize && mValues[i] == DELETED) {
                //直接取代,實現真實刪除原鍵值對
                mKeys[i] = key;
                mValues[i] = value;
                return;
            }
            //數組中可能存在延遲刪除元素且當前數組長度滿,無法添加
            if (mGarbage && mSize >= mKeys.length) {
                //真實刪除,將所有延遲刪除的元素從數組中清除;
                gc();
                //清除後重新確定當前key在數組中的目標位置;
                // Search again because indices may have changed.
                i = ~ContainerHelpers.binarySearch(mKeys, mSize, key);
            }
            //不存在垃圾或者當前數組仍然可以繼續添加元素,不需要擴容,則將i之後的元素全部後移,數組中仍然存在被DELETED的垃圾key;
            mKeys = GrowingArrayUtils.insert(mKeys, mSize, i, key);
            mValues = GrowingArrayUtils.insert(mValues, mSize, i, value);
            //新元素添加成功,潛在可用元素數量+1
            mSize++;
        }
    }

put方法也調用了ContainerHelpers.binarySearch方法先進行查找,查找到大於0,則在數組中找到了對應的key,此時,直接將value進行替換即可;如果沒有找到,返回的是~lo,將i取反後,此時i就是我們需要插入的位置。

此刻,我們找到了i,就是目標位置,如果沒有設置延遲刪除(DELETED),那麼由於數組的特點,我們需要將i序號之後的數組後移,這樣就會產生一個較大的性能損耗;,但是如果我們設置了延遲刪除且mValue[i]上當前的元素恰巧為DELETED,那麼此時我們可以用當前的key替換原來mKeys的key,且用當前value替換DELETED;這樣就成功避免了一次數組的遷移操作。

但是事情不可能永遠湊巧,如果,i上的元素並非恰好被刪除呢?那麼此時我們會判斷mGarbage,如果為true那麼我們執行一次gc,將無效數據移除,再進行一次二分查找,然後將i之後的數據全部後移,將當前key插入;如果mGarbage為false,那麼證明其中的數據全部存在,因此不需要gc,直接進行元素插入並將數組後移。

Get方法源碼:

    public E get(int key) {
        return get(key, null);
    }
     
    /**
     * Gets the Object mapped from the specified key, or the specified Object
     * if no such mapping has been made.
     */
    @SuppressWarnings("unchecked")
    public E get(int key, E valueIfKeyNotFound) {
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
     
        if (i < 0 || mValues[i] == DELETED) {
            return valueIfKeyNotFound;
        } else {
            return (E) mValues[i];
        }
    }

與HashMap做比較

1、key類型都是int,而不是Integer,相較於使用HashMap的話,省去了裝箱拆箱過程,查詢、存儲等操作效率更高,而且int的存儲開銷也遠小於Integer

2、使用二分查找法判斷元素的位置,所以,在獲取數據的時候非常快,時間複雜度為O(lgN),比HashMap快的多,因為HashMap獲取數據是通過遍歷Entry[]數組來得到對應的元素。

3、使用場景

雖說SparseArray性能比較好,但是由於其添加、查找、刪除數據都需要先進行一次二分查找,所以在數據量大的情況下性能並不明顯,將降低至少50%。滿足下麵兩個條件我們可以使用SparseArray代替HashMap:

a:數據量不大,最好在千級以內,如果在數據量比較大時,它的性能將退化至少50%。
b:key必須為int類型,這中情況下的HashMap可以用SparseArray代替。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、項目代碼 #vim /usr/local/src/mail_api_flask/run.py """ mail_api_flask 為基於Flask web框架開發的線上發送郵件api,實現功能復用。支持html模板郵件。 """ from flask import Flask from fla ...
  • Linux 中的 Bash 腳本支持對變數的操作,下麵鹹魚將介紹 Linux Bash Shell 中關於變數的 5 個易錯點 因為編程習慣,這類現象往往發生在大多數使用過其他流行編程語言的程式員身上 變數賦值 對於許多編程語言(例如 Python),變數賦值的時候在等號兩邊添加空格是一個好的習慣 ...
  • MySQL基礎:函數 函數是指一段可以直接被另一段程式調用的程式或代碼。 字元串函數 MySQL中內置了很多字元串函數,常用的幾個如下: | 函數 | 功能 | | : : | : : | | CONCAT(S1,S2,...Sn) | 字元串拼接,將S1,S2,...Sn拼接成一個字元串 | | ...
  • SQL:DML、DQL、DCL DML:Data Manipulation Language(數據操作語言) DML用來對資料庫中的數據記錄進行增刪改操作。 DML-添加數據 給指定欄位添加數據(一條數據) INSERT INTO 表名(欄位名1,欄位名2,...) VALUES(值1,值2,... ...
  • 摘要:本文就針對因USING子句的書寫方式可能導致MERGE INTO語句的執行不下推的場景,對USING子句的SQL語句進行改寫一遍,整個SQL語句可以下推。 本文分享自華為雲社區《GaussDB(DWS)運維 -- values子句做MERGE數據源導致SQL執行不下推的改寫方案》,作者: 譡里 ...
  • 什麼是主數據? 主數據是一組用於提供有關業務數據(如位置、客戶、產品、資產等)情境的標識符。它是企業或單位內運行業務必不可少的核心數據。否則,將無法統一比較系統之間的數據。但是,並非所有主數據都是一樣的。被指定為主數據的數據類型可能因行業而異。即使在同一行業的不同業務實體中,主數據的示例也可能是離散 ...
  • 眾所周知Redis有以下幾種常見的數據類型 String(字元串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(點陣圖)、HyperLogLog(基數統計)等。 我們最常用的就是String(字元串)... ...
  • 資料庫優化是一個綜合工程,不僅僅是需要DBA參與,更重要的是研發設計人員針對PG資料庫的特點來進行相關的優化設計。不過對於DBA來說,一旦接到上線和運維任務,基本上都是木已成舟,軟體設計方面留下的坑已經挖好,DBA的作為已經十分有限了。不過既然要乾運維,那麼少不了就要參與優化。PG的優化工作該如何開... ...
一周排行
    -Advertisement-
    Play Games
  • ## 引言 最近發現自己喜歡用的 Todo 軟體總是差點意思,畢竟每個人的習慣和工作流不太一樣,我就想著自己寫一個小的[Todo 項目]( https://github.com/circler3/TodoTrack ),核心的功能是自動記錄 Todo 執行過程中消耗的時間(尤其面向程式員),按照自己 ...
  • ### 前言 當我們編寫 C# 代碼時,經常需要處理大量的數據集合。在傳統的方式中,我們往往需要先將整個數據集合載入到記憶體中,然後再進行操作。但是如果數據集合非常大,這種方式就會導致記憶體占用過高,甚至可能導致程式崩潰。 C# 中的`yield return`機制可以幫助我們解決這個問題。通過使用`y ...
  • 1. ADO.NET的前世今生 ADO.NET的名稱起源於ADO(ActiveX Data Objects),是一個COM組件庫,用於在以往的Microsoft技術中訪問數據。之所以使用ADO.NET名稱,是因為Microsoft希望表明,這是在NET編程環境中優先使用的數據訪問介面。 ADO.NE ...
  • 1. 為什麼需要單元測試 在我們之前,測試某些功能是否能夠正常運行時,我們都將代碼寫到Main方法中,當我們測試第二個功能時,我們只能選擇將之前的代碼清掉,重新編寫。此時,如果你還想重新測試你之前的功能時,這時你就顯得有些難為情了,因為代碼都被你清掉了。當然你完全可以把代碼寫到一個記事本中進行記錄, ...
  • 1. 透過現象看本質 反射被譽為是 c#中的黑科技 ,在很多領域中都有反射的身影,例如,我們經常使用的ORM框架,ABP框架 等。 反射指程式可以訪問、檢測和修改它本身狀態或行為的一種能力。. 程式集包含模塊,而模塊包含類型,類型又包含成員。. 反射則提供了封裝程式集、模塊和類型的對象。. 您可以使 ...
  • # Rust Web 全棧開發之 Web Service 中的錯誤處理 ## Web Service 中的統一錯誤處理 ### Actix Web Service 自定義錯誤類型 -> 自定義錯誤轉為 HTTP Response - 資料庫 - 資料庫錯誤 - 串列化 - serde 錯誤 - I/ ...
  • 在前面的幾篇文章中,詳細地給大家介紹了Java里的集合。但在介紹集合時,我們涉及到了泛型的概念卻並沒有詳細學習,所以今天我們要花點時間給大家專門講解什麼是泛型、泛型的作用、用法、特點等內容 ...
  • ###BIO:同步阻塞 主線程發起io請求後,需要等待當前io操作完成,才能繼續執行。 ###NIO:同步非阻塞 引入selector、channel、等概念,當主線程發起io請求後,輪詢的查看系統是否準備好執行io操作,沒有準備好則主線程不會阻塞會繼續執行,準備好主線程會阻塞等待io操作完成。 # ...
  • 摘要:在讀多寫少的環境中,有沒有一種比ReadWriteLock更快的鎖呢?有,那就是JDK1.8中新增的StampedLock! 本文分享自華為雲社區《【高併發】高併發場景下一種比讀寫鎖更快的鎖》,作者: 冰 河。 什麼是StampedLock? ReadWriteLock鎖允許多個線程同時讀取共 ...
  • ## 併發與並行😣 ### 併發與並行的概念和區別 並行:同一個時間段內多個任務同時在不同的CPU核心上執行。強調同一時刻多個任務之間的”**同時執行**“。 併發:同一個時間段內多個任務都在進展。強調多個任務間的”**交替執行**“。 ![](https://img2023.cnblogs.co ...