.net源碼分析 – List<T>

来源:http://www.cnblogs.com/brookshi/archive/2016/04/09/5353021.html
-Advertisement-
Play Games

通過分析源碼可以更好理解List<T>的工作方式,幫助我們寫出更穩定的代碼。 List<T>源碼地址: https://github.com/dotnet/corefx/blob/master/src/System.Collections/src/System/Collections/Generic ...


通過分析源碼可以更好理解List<T>的工作方式,幫助我們寫出更穩定的代碼。

List<T>源碼地址: https://github.com/dotnet/corefx/blob/master/src/System.Collections/src/System/Collections/Generic/List.cs

介面

List<T>實現的介面:IList<T>, IList, IReadOnlyList<T>

其實.net framework經過多代發展,List的介面確實是有點多了,添加新功能時為了相容老功能,一些舊的介面又不能丟掉,所以看上去有點複雜。先把這些介面捋一下:

IEnumerator是枚舉器介面,擁有枚舉元素的功能,成員有Current, MoveNext, Reset,這三個函數可以使集合支持遍歷。

IEnumerable是支持枚舉介面,實現這介面表示支持遍歷,成員就是上面的IEnumerator。

ICollection是集合介面,支持著集合的Count屬性和CopyTo操作,另外還有同步的屬性IsSynchronized(判斷是否線程安全)和SyncRoot(lock的對象)

IList是集合的操作介面,支持索引器,Add, Remove, Insert, Contains等操作。

泛型部分基本是上面這些介面的泛型實現,不過IList<T>的一些操作放到ICollection<T>里了,可能微軟也覺得對於集合的一些操作放到ICollection更合理吧。

IReadOnlyCollection<T>是.net 4.5加進來的,可以認為是IList<T>的只讀版。

變數

 1 private const int _defaultCapacity = 4;
 2 
 3 private T[] _items;
 4 
 5 private int _size;
 6 
 7 private int _version;
 8 
 9 private Object _syncRoot;
10 
11 static readonly T[] _emptyArray = new T[0];

_defaultCapacity意思是new List<T>時預設大小是4。

_items就是存List<T>元素的數組了,List<T>也是基於數組實現的。

_size指元素個數。

_version看字面意思是版本,具體用處下麵看,與遍歷集合時經常碰到的集合被修改異常有關。

_syncRoot上面有說到,內置的用於lock的對象,如果在多線程時只是操作這個集合就可以lock這個來保證線程安全,當然一般來說這個是內部用的,雖然對List<T>本身來說沒什麼用,這個不取的話是不會把對象new出來的,對於鎖我們更常用的是在外面new一個readonly的object。

emptyArray這是個靜態只讀的空數組,所有沒有元素的List<T>都是用這個,所以兩個List<int>_items其實是一樣的,都是這個_emptyArray

構造函數

有三個構造函數

1 public List()
2 {
3     _items = _emptyArray;
4 }

最常用的,_items直接指向靜態空數組。

 1 public List(int capacity)
 2 {
 3     if (capacity < 0) throw new ArgumentOutOfRangeException(nameof(capacity), capacity, SR.ArgumentOutOfRange_NeedNonNegNum);
 4     Contract.EndContractBlock();
 5 
 6     if (capacity == 0)
 7         _items = _emptyArray;
 8     else
 9         _items = new T[capacity];
10 }

可以通過capacity指定大小

 1 public List(IEnumerable<T> collection)
 2 {
 3     if (collection == null)
 4         throw new ArgumentNullException(nameof(collection));
 5     Contract.EndContractBlock();
 6 
 7     ICollection<T> c = collection as ICollection<T>;
 8     if (c != null)
 9     {
10         int count = c.Count;
11         if (count == 0)
12         {
13             _items = _emptyArray;
14         }
15         else
16         {
17             _items = new T[count];
18             c.CopyTo(_items, 0);
19             _size = count;
20         }
21     }
22     else
23     {
24         _size = 0;
25         _items = _emptyArray;
26         // This enumerable could be empty.  Let Add allocate a new array, if needed.
27         // Note it will also go to _defaultCapacity first, not 1, then 2, etc.
28 
29         using (IEnumerator<T> en = collection.GetEnumerator())
30         {
31             while (en.MoveNext())
32             {
33                 Add(en.Current);
34             }
35         }
36     }
37 }

初始添加一個集合, 先看是否是ICollection,看上面知道這個介面有Copy的功能,copy到_items里。如果不是ICollection,不過由於是IEnumerable,所以可以遍歷,一個一個加到_items里。

屬性

Count 返回的是_size,這個是元素的實際個數,不是數組大小。

IsSynchronized是false,表示並非用SyncRoot 來實現同步。List<T>不是線程安全,需要我們自己用鎖搞定,

IsReadOnly也是false, 那為什麼要繼承IReadOnlyList<T>呢,是為了提供一個轉換成只讀List的機會,比如有的方法不希望傳進來的List可以修改,就可以把參數設成IReadOnlyList。

 1 Object System.Collections.ICollection.SyncRoot
 2 {
 3     get
 4     {
 5         if (_syncRoot == null)
 6         {
 7             System.Threading.Interlocked.CompareExchange<Object>(ref _syncRoot, new Object(), null);
 8         }
 9         return _syncRoot;
10     }
11 }

SyncRoot通過原子操作得到一個對象,對於List<T>來說並沒有用,對於某些集合比較有用,比如SyncHashtable,就是通過syncRoot來實現線程安全。

比較重要的Capacity:

 1 public int Capacity
 2 {
 3     get
 4     {
 5         Contract.Ensures(Contract.Result<int>() >= 0);
 6         return _items.Length;
 7     }
 8     set
 9     {
10         if (value < _size)
11         {
12             throw new ArgumentOutOfRangeException(nameof(value), value, SR.ArgumentOutOfRange_SmallCapacity);
13         }
14         Contract.EndContractBlock();
15 
16         if (value != _items.Length)
17         {
18             if (value > 0)
19             {
20                 var items = new T[value];
21                 Array.Copy(_items, 0, items, 0, _size);
22                 _items = items;
23             }
24             else
25             {
26                 _items = _emptyArray;
27             }
28         }
29     }
30 }

Capacity取的就是數組的長度,另外我們可以通過CapacityList設置大小,即使這個List裡面已經有元素,會先new一個目標大小的數組,然後通過Array.Copy把現有元素複製到新數組裡。但一般情況下這些不用我們設置Capacity,添加新元素時發現長度不夠會自動擴大數組。Capacityint型,說明最大是int.MaxValue,大約2G個,如果我們直接給List設置int.MaxValue就要看你的記憶體夠不夠2G*4也就是8G了,不夠的話會報OutofMemory Exception。其實個人覺得這裡Capacity用uint是不是更好。

用100M個,記憶體占用400M多

同樣100M個,由於是long,記憶體占了800M多

方法

看幾個重要的方法:

1 public void Add(T item)
2 {
3     if (_size == _items.Length) EnsureCapacity(_size + 1);
4     _items[_size++] = item;
5     _version++;
6 }

當前數組大小和元素個數相等時表明再Add的話大小不夠了,需要先通過EnsureCapacity擴容, _size+1指明瞭一個最小的擴容目標。

 1 private void EnsureCapacity(int min)
 2 {
 3     if (_items.Length < min)
 4     {
 5         int newCapacity = _items.Length == 0 ? _defaultCapacity : _items.Length * 2;
 6         // Allow the list to grow to maximum possible capacity (~2G elements) before encountering overflow.
 7         // Note that this check works even when _items.Length overflowed thanks to the (uint) cast
 8         //if ((uint)newCapacity > Array.MaxArrayLength) newCapacity = Array.MaxArrayLength;
 9         if (newCapacity < min) newCapacity = min;
10         Capacity = newCapacity;
11     }
12 }

擴容方法,如果數組長度是0的話則用_defaultCapacity也就是4來做為數組長度,否則則以當前元素個數的2倍去擴大。如果新得到的長度比傳進來的min小的話則就用min,也就是選大的,這種情況在InsertRange時有可能發生,因為insert的list很可能比當前list的元素個數多。

Add函數里還有個_version++,這個_version可以在很多方法里看到,如remove, insert, sort等,但凡要修改集合都需要_version++。那這個_version有什麼用呢?

 1 public void ForEach(Action<T> action)
 2 {
 3     if (action == null)
 4     {
 5         throw new ArgumentNullException(nameof(action));
 6     }
 7 
 8     int version = _version;
 9 
10     for (int i = 0; i < _size; i++)
11     {
12         if (version != _version)
13         {
14             break;
15         }
16         action(_items[i]);
17     }
18 
19     if (version != _version)
20         throw new InvalidOperationException(SR.InvalidOperation_EnumFailedVersion);
21 }

在遍歷時如果發現_version變了立即退出並拋出遍歷過程集合被修改異常,比如在foreach里remove或add元素就會導致這個異常。更常見的是出現在多線程時一個線程遍歷集合,另一個線程修改集合的時候,相信很多人吃過苦頭。

如果一個線程時想在遍歷時修改集合,比如刪除,可以用原始的for(int i=list.Count-1;i>=0;i--)方式。

另外用到version還有枚舉器Enumerator,MoveNext過程中同樣會檢測這個。

其他大部分方法都是通過Array的靜態函數實現,不多說,需要註意的是List<T>繼承自IList,所以可以轉成IList,轉之後泛型就沒了,如果是List<int>,轉成IList的話和IList<object>沒什麼兩樣,裝拆箱帶來的性能損失也值得註意。

總結

List<T>初始大小是4,自動擴容是以當前數組元素的兩倍或InsertRange目標list的元素個數來擴容(哪個大選哪個)。如果有比較確定的大小可以考慮提前設置,因為每次自動擴容需要重新分配數組和copy元素,性能損耗不小。

List<T>通過version來跟蹤集合是否發生改變,如果在foreach遍歷時發生改變則拋出異常。

List<T>並非線程安全,任何使用的時候都要考慮當前環境是否可能有多線程存在,是否需要用鎖來保證集合線程安全。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 大家都知道 Windows 有休眠模式,其實 Ubuntu 也有。休眠模式簡單來說,就是可以在用戶暫時離開時將記憶體中的所有內容都寫入到硬碟當中,當用戶下次開機時,就可以直接啟動到上次保存的時間狀態。 打個比方,你正用 LibreOffice 在處理一個文檔,同時打開了很多參考網頁和其它文件,下班時間 ...
  • .NET CORE的官方(http://dotnet.github.io/getting-started/)只提供了Windows, Ubuntu14.04, 及Docker(也是基於Ubuntu14.04做的Image). 但鑒於微軟已經把RedHat做為參考平臺而且用Ubuntu14.04做Se ...
  • SCP服務實現Linux交互 在實際工作中,我們可以使用scp伺服器進行Linux與Linux之間的信息交互。 基本指令: scp 本地文件 遠程文件 scp 遠程文件 本地文件 scp –r 文件夾 文件夾 scp –P 埠 文件 文件 例1:上傳文件到其... ...
  • tcp簡單實驗 server.c #include /* See NOTES */ #include #include #include #include #include #include #include #include /*socket * bind * listen * accept * ... ...
  • 其實之前也有提及過,Cypress公司提供的官方文件和應用手冊真的可以解決很多問題。做的也很人性化,操作也及其簡單,幾乎只要在 TD_int()裡面配置一些常用的參數即可,其他都可以不用操作。 作為一個常用查詢手冊吧!!!! 《EZ-USB一些重要寄存器的配置》博客中已經提及過相關寄存器的配置,那麼 ...
  • 簡介: LVM ( Logical Volume Manager ) 邏輯捲管理 一、創建 LV 1、首先在你的虛擬機上添加一塊新的硬碟用來做實驗。 2、安裝 lvm : yum -y install lvm2 3、查看新添加的磁碟 ## 其中,/dev/sdb 就是我新添加的磁碟了 4、創建物理分 ...
  • 有這樣的兩個集合: string[] bigArr = new string[] { "a", "b", "c" };string[] smallArr = new string[] { "a", "b"}; 現在需要判斷smallArr是否是bigArr的子集。只要拿著bigArray和small ...
  • 用途:簡化代碼 說明: int a; //a<>null int ?b; //b=null int ?c = b+1; //c=null; int?a=null; int b;(聲明a和b) b=a??2; //b=2; a=6;b=a??8;//b=6; int a=1>0?1:0 //a=1; ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...