[Python] 迭代器是什麼?你每天在用的for迴圈都依賴它!

来源:https://www.cnblogs.com/ayistar/archive/2019/08/20/11380640.html
-Advertisement-
Play Games

從迴圈說起 順序 , 分支 , 迴圈 是編程語言的三大邏輯結構,在Python中都得到了支持,而Python更是為迴圈結構提供了非常便利的語法: 剛從C語言轉入Python的同學可能傾向於寫索引下標式的迴圈,例如下麵的代碼像遍歷C中的數組一樣遍歷了一個Python中的列表: 但如果將列表(list) ...


從迴圈說起

順序分支迴圈是編程語言的三大邏輯結構,在Python中都得到了支持,而Python更是為迴圈結構提供了非常便利的語法:for ... in ...

剛從C語言轉入Python的同學可能傾向於寫索引下標式的迴圈,例如下麵的代碼像遍歷C中的數組一樣遍歷了一個Python中的列表:

>>> colors = ['black', 'white', 'red', 'blue']
>>> for i in range(len(colors)):
...     print(colors[i])
...
black
white
red
blue

但如果將列表(list)替換為集合(set),這個方法就不奏效了:

>>> colors = set(['black', 'white', 'red', 'blue'])
>>> for i in range(len(colors)):
...     print(colors[i])
...
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: 'set' object does not support indexing

這是因為set不像list,string,tuple這些結構,其中的元素從邏輯上講本身是沒有序的,與之類似的還有dict,因而Python在設計set這個內置數據結構時,並沒有實現其下標索引。但遍歷集合這個操作本身是合理並且常見的,我們可以如下實現對集合的遍歷:

>>> colors = set(['black', 'white', 'red', 'blue'])
>>> for color in colors:
...     print(color)
...
red
blue
black
white

至於元素輸出的順序為何是這樣,這與set的具體實現有關,不在本文的討論範圍內,本文要探究的是,這種for...in...迴圈到底是如何運作的。


輪到你出場了,迭代器

想知道for迴圈的運作模式,首先要介紹迭代器(iterator)的概念。迭代器並不是Python獨有的概念,事實上,在C++,Java等其他語言中,都可以看到迭代器的身影,站在更高的角度,迭代器不是一個語言特性,而是一種設計模式,它提升了語言的抽象能力和代碼的服用,減少程式員的心智負擔。為證明這一點,下麵我們就以Python中的迭代器進行說明。

在Python中,迭代器泛指一類實現了迭代器協議的對象,具體來說,任何實現了__next__函數的對象都是迭代器,該函數可以通過Python的內置函數next進行調用,該函數的邏輯應該返回數據結構中的下一個迭代對象或拋出StopIteration異常。以下代碼是列表迭代器的一個示例,我們暫時不關心該列表迭代器是怎麼來的。

>>> colors = ['black', 'white', 'red', 'blue']
>>> color_iterator = iter(colors)
>>> next(color_iterator)
'black'
>>> next(color_iterator)
'white'
>>> next(color_iterator)
'red'
>>> next(color_iterator)
'blue'
>>> next(color_iterator)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

可以看到,每次對迭代器調用next函數,迭代器或返回應被迭代的下一個對象,或拋出一個StopIteration異常,上層的調用者可通過捕獲該異常得知迭代已經結束。


他來了,可迭代對象

可迭代對象(Iterable)是另一個重要概念,顧名思義,它應該泛指滿足可以被迭代,即擁有迭代器的一類對象。在Python的迭代器協議里,任何實現了__iter__函數的對象都是可迭代對象,該函數可以通過Python的內置函數iter調用,該函數邏輯上應該返回一個迭代器對象,即返回一個實現了__next__函數的對象。我們還是以列表作為例子。

>>> colors = ['black', 'white', 'red', 'blue']
>>> type(colors)
<class 'list'>
>>> color_iterator = iter(colors)
>>> type(color_iterator)
<class 'list_iterator'>

可以看到,colorscolor_iterator是兩個不同的對象,後者是前者的__iter__函數返回的一個新對象。


為什麼要這麼複雜?

你可能已經在問了,為什麼要制定這麼複雜的所謂協議?是的,對於每一個類來說,按照規定實現__next____iter__方法聽上去很麻煩。但是,當很多類都遵循這個協議麻煩一點的時候,對於調用者而言,事情開始變得簡單。換句話說,當所有邏輯上可以被迭代的對象都告訴你,”我已經按照迭代器協議實現了協議里要求的方法“,作為調用者,你不必再關心他們怎麼實現的,你可以用一個統一的方式去迭代他們,無論這是一個列表,一個字元串,一個集合,還是一個字典。

事實上,for...in...就是這麼做的。


揭秘for迴圈

Python的for...in...迴圈實際上等價於以下代碼

colors = ['black', 'white', 'red', 'blue']

for color in colors:
    print(color)
# 等價於
color_iterator = iter(colors)
while True:
    try:
        color = next(color_iterator)
        print(color)
    except StopIteration:
        break

當我們毫無顧忌地對列表/字元串/集合/字典/...各式各樣的數據結構for...in...時,Python並不是像魔法師一樣天然地知道這些對象該怎麼去遍歷,而是按部就班地用iter取出迭代器,用next取出下一個迭代對象,如果捕獲StopIteration,就停止迭代。所以,這些功勞來自於這些對象嚴格地遵從了迭代器協議


自己實現一個可迭代對象

當我們自定義類時,是不是也應該考慮調用者的感受?下麵我們就自己實現一個符合迭代器協議的類。

class MyIterable():
    def __init__(self):
        self.data = ['I', 'love', 'python']
    def __iter__(self):
        self.index = 0
        return self
    def __next__(self):
        if self.index < len(self.data):
            ret = self.data[self.index]
            self.index += 1
            return ret
        else:
            raise StopIteration

a = MyIterable()
for x in a:
    print(x)

'''
執行結果:
I
love
Python
'''

解釋一下:MyIterable的數據存放在成員變數data中,即實現了__next__的方法,所以本身就是一個迭代器,因而它的__iter__只需要返回self,但在返回之前,將成員變數index歸0,意味著從頭開始迭代。在__next__中,如果index比元素總數少,則返回該下標索引的數據,並使得索引自增,否則就拋出StopIteration表示迭代結束。

可以看到,在調用者看來,MyIterable的數據內部是如何存放的,一共有多少數據,該怎麼訪問他們,這些都不用關心,只要MyIterable老老實實地遵守了迭代器協議,一句for...in...就能進行遍歷。


總結

我們通過深入解析Pyhton中for迴圈的工作機制,接觸了迭代器可迭代對象這些Python中乃至通用編程中重要的概念。可以說,迭代器具體來說是語言所規定的一種協議,一個具體的對象實現了協議所規定的介面後,就能讓自己看上去是一個迭代器,使用者使用起來也只需要按照介面去使用,減少了心智負擔;更抽象來說,迭代器是一種設計模式,對於遍歷這種編程中非常常用的操作,通過指定某種模式和規則,讓代碼的開發和調用都變得更加規範,更加方便。

迭代器在Python中的使用當然不止for迴圈這麼簡單,在生成器等更高級的語法糖中,迭代器也扮演至關重要的角色,歡迎大家持續關註!

獲取最新文章更新,歡迎關註我的個人公眾號:StackOverflow Daily


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本篇筆記只敘述 var 與 let 的區別 var 是可以進行變數的提升的,好比先定義一個變數,不指定類型,後面再用 var 來聲明它,於是它從無類型變成了有類型,但是這樣是不好的 當你使用 var 時,可以根據需要多次聲明相同名稱的變數,但是 let 不能。 而對面 let 來說,它更像我們學的 ...
  • jQueryt靜態方法詳解 ==> each ==> map ==> trim ==> isArray ==> isFunction ==> isWindow ==> holdReady 一,each方法 註:為了更好的展示,首先創建一個數組和一個對象 (let 與 arr 區別詳解見 JavaSc ...
  • 分散式事務的挑戰 在多個服務、資料庫和消息代理之間維持數據的一致性的傳統方式是採用分散式事務。分散式的事實標註是XA、XA採用了兩階段提交老保證事務中的所有參與方同時完成提交,或者失敗時同時回滾。應用程式的整個技術棧需要滿足XA標準。 許多新技術,包括NoSQLshujk ,liru MongoDB ...
  • 背景 自己手上有一個項目服務用的是AWS EC2,最近從安全性和性能方面考慮,最近打算把騰訊雲的MySQL資料庫遷移到AWS RDS上,因為AWS的出口規則和安全組等問題,我需要修改預設的3306埠和Bind Address限制特定的IP訪問,我在Stackoverflow上查詢瞭如何修改,但是網 ...
  • SpringMVC 原理 設計原理、啟動過程、請求處理詳細解讀 目錄 "一、 設計原理" "二、 啟動過程" "三、 請求處理" 一、 設計原理 Servlet 規範 SpringMVC 是基於 Servlet 的。 Servlet 是運行在 web 伺服器上的程式,它接收並響應來自 web 客戶端 ...
  • Django自定義分頁並保存搜索條件 1、自定義分頁組件pagination.py 2、view視圖 3、templates模板 4、頁面展示 ...
  • 什麼是內置函數? 就是Python中已經寫好了的函數,可以直接使用 內置函數圖表: 以3.6.2為例 ...
  • Spring boot 應用可以添加依賴 來構建響應式 Web 應用程式。 內置響應式伺服器 Spring Boot WebFlux 內置 Reactor Netty、Tomcat、Jetty 和 Undertow。預設埠是 8080。 WebFlux 的 CRUD 示例 Springboot W ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...