Python中list的實現

来源:http://www.cnblogs.com/Vito2008/archive/2016/01/19/5141546.html
-Advertisement-
Play Games

原文鏈接這篇文章介紹了Python中list是如何實現的。在Python中list特別有用。讓我們來看下list的內部是如何實現的。來看下麵簡單的程式,在list中添加一些整數並將他們列印出來。>>> L = []>>> L.append(1)>>> L.append(2)>>> L.append(...


原文鏈接
這篇文章介紹了Python中list是如何實現的。
在Python中list特別有用。讓我們來看下list的內部是如何實現的。
來看下麵簡單的程式,在list中添加一些整數並將他們列印出來。

>>> L = []
>>> L.append(1)
>>> L.append(2)
>>> L.append(3)
>>> L
[1, 2, 3]
>>> for e in L:
...   print e
... 
1   
2   
3   

正如你所看到的,list是可以迭代的。

List對象的C結構

Python中list是用下邊的C語言的結構來表示的。ob_item是用來保存元素的指針數組,allocated是ob_item預先分配的記憶體總容量

typedef struct {
    PyObject_VAR_HEAD
    PyObject **ob_item;
    Py_ssize_t allocated;
} PyListObject;

List的初始化

讓我們來看下當初始化一個空list的時候發生了什麼 L = []

arguments: size of the list = 0
returns: list object = []
PyListNew:
    nbytes = size * size of global Python object = 0
    allocate new list object
    allocate list of pointers (ob_item) of size nbytes = 0
    clear ob_item
    set list's allocated var to 0 = 0 slots
    return list object 

非常重要的是知道list申請記憶體空間的大小(後文用allocated代替)的大小和list實際存儲元素所占空間的大小(ob_size)之間的關係,ob_size的大小和len(L)是一樣的,而allocated的大小是在記憶體中已經申請空間大小。通常你會看到allocated的值要比ob_size的值要大。這是為了避免每次有新元素加入list時都要調用realloc進行記憶體分配。接下來我們會看到更多關於這些的內容。

Append

我們在list中追加一個整數:L.append(1)。發生了什麼?調用了內部的C函數app1()

arguments: list object, new element
returns: 0 if OK, -1 if not
app1:
    n = size of list
    call list_resize() to resize the list to size n+1 = 0 + 1 = 1
    list[n] = list[0] = new element
    return 0

來讓我們看下list_resize(),list_resize()會申請多餘的空間以避免調用多次list_resize()函數,list增長的模型是:0, 4, 8, 16, 25, 35, 46, 58, 72, 88, …

arguments: list object, new size
returns: 0 if OK, -1 if not
list_resize:
    new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6) = 3
    new_allocated += newsize = 3 + 1 = 4
    resize ob_item (list of pointers) to size new_allocated
    return 0

開闢了四個記憶體空間來存放list中的元素,存放的第一個元素是1。你可以從下圖中看到L[0]指向了我們剛剛加進去的元素。虛線的框代表了申請了但是還沒有使用(存儲元素)的記憶體空間

我們繼續加入一個元素:L.append(2)。調用list_resize,同時n+1=2。但是因為allocated(譯者註:已經申請的空間大小)是4。所以沒有必要去申請新的記憶體空間。相同的事情發生在再次在list中添加兩個元素的時候: L.append(3),L.append(4)。下圖展示了到目前為止我們做了什麼。

Insert

現在我們在列表的第一個位置插入一個整數5:L.insert(1, 5),看看內部發生了什麼。調用了ins1()

arguments: list object, where, new element
returns: 0 if OK, -1 if not
ins1:
    resize list to size n+1 = 5 -> 4 more slots will be allocated
    starting at the last element up to the offset where, right shift each element 
    set new element at offset where
    return 0  


虛線框表示已經申請但是沒有使用的記憶體。申請了8個記憶體空間但是list實際用來存儲元素只使用了其中5個記憶體空間
insert的時間複雜度是O(n)

Pop

當你彈出list的最後一個元素:L.pop()。調用listpop(),list_resize在函數listpop()內部被調用,如果這時ob_size(譯者註:彈出元素後)小於allocated(譯者註:已經申請的記憶體空間)的一半。這時申請的記憶體空間將會縮小。

arguments: list object
returns: element popped
listpop:
    if list empty:
        return null
    resize list with size 5 - 1 = 4. 4 is not less than 8/2 so no shrinkage
    set list object size to 4
    return last element

Pop的時間複雜度是O(1)

你可以發現4號記憶體空間指向還指向那個數值(譯者註:彈出去的那個數值),但是很重要的是ob_size現在卻成了4.
讓我們再彈出一個元素。在list_resize內部,size – 1 = 4 – 1 = 3 比allocated(已經申請的空間)的一半還要小。所以list的申請空間縮小到
6個,list的實際使用空間現在是3個(譯者註:根據(newsize >> 3) + (newsize < 9 ? 3 : 6) = 3在文章最後有詳述)
你可以發現(下圖)3號和4號記憶體空間還存儲著一些整數,但是list的實際使用(存儲元素)空間卻只有3個了。

Remove

Python list對象有一個方法可以移除一個指定的元素。調用listremove()。

arguments: list object, element to remove
returns none if OK, null if not
listremove:
    loop through each list element:
    if correct element:
        slice list between element's slot and element's slot + 1
        return none
    return null

切開list和刪除元素,調用了list_ass_slice()(譯者註:在上文slice list between element's slot and element's slot + 1被調用),來看下list_ass_slice()是如何工作的。在這裡,低位為1 高位為2(譯者註:傳入的參數),我們移除在1號記憶體空間存儲的數據5

arguments: list object, low offset, high offset
returns: 0 if OK
list_ass_slice:
    copy integer 5 to recycle list to dereference it
    shift elements from slot 2 to slot 1
    resize list to 5 slots
    return 0

Remove的時間複雜度為O(n)

譯者註:

文中list的sort部分沒有進行翻譯
核心部分

我們能看到 Python 設計者的苦心。在需要的時候擴容,但又不允許過度的浪費,適當的記憶體回收是非常必要的。
這個確定調整後的空間大小演算法很有意思。
調整後大小 (new_allocated) = 新元素數量 (newsize) + 預留空間 (new_allocated)
調整後的空間肯定能存儲 newsize 個元素。要關註的是預留空間的增長狀況。
將預留演算法改成 Python 版就更清楚了:(newsize // 8) + (newsize < 9 and 3 or 6)。
當 newsize >= allocated,自然按照這個新的長度 "擴容" 記憶體。
而如果 newsize < allocated,且利用率低於一半呢?
allocated    newsize       new_size + new_allocated
10           4             4 + 3
20           9             9 + 7
很顯然,這個新長度小於原來的已分配空間長度,自然會導致 realloc 收縮記憶體。(不容易啊)
引自《深入Python編程》
 

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 對於一些圖片多,頁面長的網頁來說,如果每次打開頁面載入全部的網頁內容,頁面載入速度勢必會受到影響,如果每次打開網頁只將網頁可視區域的內容載入給用戶 ,將大大提高網頁瀏覽速度,同時也減輕伺服器負載,我們可以使用lazyload.js來實現對圖片的延遲載入,當網頁圖片進入到瀏覽器可視區域時,才會去請求服...
  • 話說是這樣的,這兩天開發一個簡訊發送功能,客戶給了一個 Web Service 地址(沒有文檔),讓我調用就可以發送了,我在VS 2013添加了服務引用,一切正常,可是執行代理方法時,怎麼都報錯RPC Message receiveExtMTPushRequest1 in operation rec...
  • 訂單管理是ERP系統中一個重要模塊,客戶下訂單,ERP通過訂單來為客戶進行配送。訂單模塊主要包括訂單創建,訂單修改,訂單審核,訂單取消,訂單分配,訂單列印,訂單揀貨,訂單出庫。在隨後的幾節里我們看看這些每個模塊是怎麼設計運行的。 1.訂單創建 訂單創建主要功能是下單,下單的時候輸入收貨人信息,...
  • Qt 是目前最先進、最完整的跨平臺C++開發工具。它不僅完全實現了一次編寫,所有平臺無差別運行,更提供了幾乎所有開發過程中需要用到的工具。如今,Qt已被運用於超過70個行業、數千家企業,支持數百萬設備及應用。
  • 要想將 TextBlock 里的文本自動換行的話,只需要設置 TextWrapping 屬性為 Wrap 即可。但是 TextWrapping 是儘可能根據空白字元來換行的,因此,就有可能出現下麵這種狀況:每一行的尾部會出現長短不一的空白。在 UI 設計上,有一點建議,那就是同一級的內容是要對齊的。...
  • 使用PHP的array_unique()函數允許你傳遞一個數組,然後移除重覆的值,返回一個擁有唯一值的數組。這個函數大多數情況下都能工作得很好。但是,如果你嘗試在一個大的數組裡使用array_unique()函數,它會運行地慢一些。 有一個比較好而且更快的函數array_flip()來替代使用ar...
  • Ruby對象數組的排序作者剛剛接觸Ruby,因之前總認為腳本語言語法不規範,對腳本語言有些偏見,如不是項目需要並不會去學習PYTHON、RUBY等語言。現在項目中需要實現對象數組排序的任務,對於昨天開始看ruby的我來說壓力山大啊!【汗】但是經過一番查詢資料,終於初步實現了自己想要的結果,現將自己做...
  • 在百度知道上看到一個排列組合的一個提問,一想還是比較容易的主要採用取餘的方法. 這裡用C寫了一段代碼測試了一下.代碼比較水,主要看後面的數學分析. 想想還是高中生 的時候比較厲害,啥都會,啥都算的快. 現在打游戲都力不從心了. 同學們四年游戲專業一定要好好學.不留遺憾.
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...