搞清楚 Python 的迭代器、可迭代對象、生成器

来源:https://www.cnblogs.com/kevinbai/archive/2019/11/12/11839390.html
-Advertisement-
Play Games

很多伙伴對 Python 的迭代器、可迭代對象、生成器這幾個概念有點搞不清楚,我來說說我的理解,希望對需要的朋友有所幫助。 1 迭代器協議 迭代器協議是核心,搞懂了這個,上面的幾個概念也就很好理解了。 所謂迭代器協議,就是要求一個迭代器必須要實現如下兩個方法 Return the iterator ...


很多伙伴對 Python 的迭代器、可迭代對象、生成器這幾個概念有點搞不清楚,我來說說我的理解,希望對需要的朋友有所幫助。

1 迭代器協議

迭代器協議是核心,搞懂了這個,上面的幾個概念也就很好理解了。

所謂迭代器協議,就是要求一個迭代器必須要實現如下兩個方法

iterator.__iter__()
Return the iterator object itself.

iterator.__next__()
Return the next item from the container.

也就是說,一個對象只要支持上面兩個方法,就是迭代器。__iter__() 需要返回迭代器本身,而 __next__() 需要返回下一個元素。

2 可迭代對象

知道了迭代器的概念,那可迭代對象又是啥呢?

這個更簡單,只要對象實現了 __iter__() 方法,並且返回的是一個迭代器,那麼這個對象就是可迭代對象。

比如我們常見的列表就是可迭代對象

>>> l = [1, 3, 5]
>>> iter(l)
<list_iterator object at 0x101a1d9e8>

使用 iter() 會調用對應的 __iter__() 方法,這裡返回的是一個列表迭代器,所以說列表就是一個可迭代對象。

3 手寫一個迭代器

迭代器的實現有不同的方式,相信大家首先能想到的就是自定義類,我們就從這個說起。

便於說明,我們手寫一個迭代器,用於生成奇數序列。

按照迭代器協議,我們實現上述的兩個方法。

class Odd:
    def __init__(self, start=1):
        self.cur = start

    def __iter__(self):
        return self

    def __next__(self):
        ret_val = self.cur
        self.cur += 2
        return ret_val

終端里,我們實例化一個 Odd 類得到一個對象 odd

>>> odd = Odd()
>>> odd
<__main__.Odd object at 0x101a1d9b0>

使用 iter() 方法會調用類里的 __iter__ 方法,得到它本身

>>> iter(odd)
<__main__.Odd object at 0x101a1d9b0>

使用 next() 方法會調用對應的 __next__() 方法,得到下一個元素

>>> next(odd)
1
>>> next(odd)
3
>>> next(odd)
5

其實,odd 對象就是一個迭代器了。

我們可以用 for 來遍歷它

odd = Odd()
for v in odd:
    print(v)

細心的伙伴可能會發現,這個其實會無限的列印下去,那怎麼解決呢?

我們拿一個列表做做實驗,先得到它的迭代器對象

>>> l = [1, 3, 5]
>>> li = iter(l)
>>> li
<list_iterator object at 0x101a1da90>

然後手動獲取下一個元素,直到沒有下一個元素為止,看下會發生什麼

>>> next(li)
1
>>> next(li)
3
>>> next(li)
5
>>> next(li)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

原來列表迭代器會在沒有下一個元素的時候拋出 StopIteration 異常,估計 for 語句就是根據這個異常來確定是否結束。

我們修改一下原來的代碼,能生成指定範圍內的奇數

class Odd:
    def __init__(self, start=1, end=10):
        self.cur = start
        self.end = end

    def __iter__(self):
        return self

    def __next__(self):
        if self.cur > self.end:
            raise StopIteration
        ret_val = self.cur
        self.cur += 2
        return ret_val

我們使用 for 試一下

>>> odd = Odd(1, 10)
>>> for v in odd:
...     print(v)
...
1
3
5
7
9

果然,和預期一致。

我們用 while 迴圈模擬 for 的執行過程

目標代碼

for v in iterable:
    print(v)

翻譯後的代碼

iterator = iter(iterable)
while True:
    try:
        v = next(iterator)
        print(v)
    except StopIteration:
        break

事實上 Python 的 for 語句原理也就是這樣,可以將 for 理解為一個語法糖。

4 創建迭代器的其它方式

生成器其實也是迭代器,所以可以使用生成器的創建方式創建迭代器。

4.1 生成器函數

和普通函數的 return 返回不同,生成器函數使用 yield。

>>> def odd_func(start=1, end=10):
...     for val in range(start, end + 1):
...         if val % 2 == 1:
...             yield val
...
>>> of = odd_func(1, 5)
>>> of
<generator object odd_func at 0x101a14200>
>>> iter(of)
<generator object odd_func at 0x101a14200>
>>> next(of)
1
>>> next(of)
3
>>> next(of)
5
>>> next(of)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

4.2 生成器表達式

>>> g = (v for v in range(1, 5 + 1) if v % 2 == 1)
>>> g
<generator object <genexpr> at 0x101a142b0>
>>> iter(g)
<generator object <genexpr> at 0x101a142b0>
>>> next(g)
1
>>> next(g)
3
>>> next(g)
5
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

4.3 怎麼選擇

到現在為止,我們知道了創建迭代器的 3 種方式,那麼該如何選擇?

不用說也知道,最簡單的就是生成器表達式,如果表達式能滿足需求,那麼就是它;如果需要添加比較複雜的邏輯就選生成器函數;如果前兩者沒法滿足需求,那就自定義類實現吧。總之,選擇最簡單的方式就行。

5 迭代器的特點

5.1 惰性

迭代器並不是把所有的元素提前計算出來,而是在需要的時候才計算返回。

5.2 支持無限個元素

比如上面我們建立的第一個 Odd 類,它的實例 odd 表示大於 start 的所有奇數,而列表等容器沒法容納無限個元素的。

5.3 省空間

比如存 10000 個元素

>>> from sys import getsizeof
>>> a = [1] * 10000
>>> getsizeof(a)
80064

列表占用 80K 左右。

而迭代器呢?

>>> from itertools import repeat
>>> b = repeat(1, times=10000)
>>> getsizeof(b)
56

只占用了 56 個位元組。

也正因為迭代器惰性的特點,才有了這個優勢。

6 一些需要註意的細節

6.1 迭代器同時也是可迭代對象

因為迭代器的 __iter__() 方法返回了它自身,而正好它本身就是個迭代器,所以說迭代器也是可迭代對象。

6.2 迭代器遍歷完一次就不能從頭開始了

看一個奇怪的例子

>>> l = [1, 3, 5]
>>> li = iter(l)
>>> li
<list_iterator object at 0x101a1da90>
>>> 3 in li
True
>>> 3 in li
False

因為 li 是列表迭代器,第一次查找 3 的時候,找到了,所以返回 True,但是由於第一次迭代,已經跳過了 3 那個元素,第二次就找不到了,所以會出現 False。

因此,記得迭代器是「一次性」的。

當然,列表是可迭代對象,不管查找幾次都是正常的。(不好理解的話,想想上面 for 語句的執行原理,每次都會從可迭代對象那通過 iter() 方法取到新的迭代器)

>>> 3 in l
True
>>> 3 in l
True

7 小節

  • 實現了迭代器協議的對象都是迭代器
  • 實現了 __iter__() 方法並返回迭代器的對象是可迭代對象
  • 生成器也是一種迭代器
  • 創建迭代器有三種方式,生成器表達式、生成器函數、自定義類,看情況選擇最簡單的就好
  • 迭代器同時也是可迭代對象
  • 迭代器是「一次性」的

前面 3 小項是重點,這 3 點理解了,其它的也都能領會。搞清楚標題的那幾個名詞的概念的自然也沒有問題。

8 參考

原文鏈接:http://www.kevinbai.com/articles/25.html

關註「小小後端」公眾號,更多乾貨等著你喔!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近在工作中遇到了一個百度地圖api中的難題,恐怕有的程式員可能也遇到過。就是實時定位並顯示軌跡,網上大部分都是通過創建polyline對象貼到地圖上。當然,百度地圖的畫線就是這樣實現的,但是好多人會發現,如果數據量超過四五千的話,瀏覽器可能就要卡了,後面可能就直接因為瀏覽器記憶體不足直接崩潰。按理講 ...
  • 文字摺疊效果 1. 效果展示 2. 實現過程 ~~~html H e l l o W o r l d ~~~ 填充內容 CSS佈局 ~~~css { margin:0px; padding:0px; } body{ background color:aquamarine; width:100%; h ...
  • 1.什麼是window? window:是一個全局對象, 代表瀏覽器中一個打開的視窗, 每個視窗都是一個window對象2.什麼是document? document是window的一個屬性, 這個屬性是一個對象 document: 代表當前視窗中的整個網頁, document對象保存了網頁上所有的 ...
  • 本節說一下DOM操作模塊里的複製元素子模塊,該模塊可以複製一個DOM節點,並且可選擇的設置是否複製其數據緩存對象(包含事件信息)和是否深度複製(子孫節點等),API如下: $.clone(elem, dataAndEvents, deepDataAndEvents) ;jQuery底層方法,返回DO ...
  • 場景 Nginx配置實例-負載均衡實例:平均訪問多台伺服器: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/103019576 在上面實現了負載均衡的簡單實例,平均訪問兩個伺服器。 但是如果不想使其平均訪問,有哪些常用的分配伺服器 ...
  • 場景 Nginx配置實例-反向代理實例:根據訪問的路徑跳轉到不同埠的服務中: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/102963715 在上個實例中,搭建好兩台tomcat伺服器。 負載均衡實現效果 瀏覽器輸入訪問地址, ...
  • Map介面概述: 現實生活中,我們常會看到這樣的一種集合:IP地址與主機名,身份證號與個人,系統用戶名與系統用戶對象等, 這種一一對應的關係,就叫做映射。Java提供了專門的集合類用來存放這種對象關係的對象,即 java.util.Map 介面 Map介面與Collection介面的區別: Coll ...
  • 一、貪婪和非貪婪 1.貪婪:儘可能多的匹配,(*)表示貪婪匹配 2.非貪婪:找到符合條件的最小內容即可,(?)表示非貪婪 3.正則預設使用貪婪匹配 import re title = u"<div>name</div><div>age</div>" p1 = re.compile(r"<div>.* ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...