Python generator和yield介紹

来源:https://www.cnblogs.com/yssjun/archive/2019/01/20/10236126.html
-Advertisement-
Play Games

Python生成器(generator)並不是一個晦澀難懂的概念。相比於MetaClass和Closure等概念,其較為容易理解和掌握。但相對於程式結構:順序、迴圈和分支而言其又不是特別的直觀。無論學習任何的東西,概念都是非常重要的。正確樹立並掌握一些基礎的概念是靈活和合理運用的前提,本文將以一種通 ...


Python生成器(generator)並不是一個晦澀難懂的概念。相比於MetaClass和Closure等概念,其較為容易理解和掌握。但相對於程式結構:順序、迴圈和分支而言其又不是特別的直觀。無論學習任何的東西,概念都是非常重要的。正確樹立並掌握一些基礎的概念是靈活和合理運用的前提,本文將以一種通俗易懂的方式介紹一下generator和yield表達式。

1. Iterator與Iterable

首先明白兩點:

  1. Iterator(迭代器)是可迭代對象;
  2. 可迭代對象並不一定是Iterator;

比較常見的數據類型list、tuple、dict等都是可迭代的,屬於collections.Iterable類型;

迭代器不僅可迭代還可以被內置函數next調用,屬於collections.Iterator類型;

迭代器是特殊的可迭代對象,是可迭代對象的一個子集。

將要介紹的gererator(生成器)是types.GeneratorType類型,也是collections.Iterator類型。

也就是說生成器是迭代器,可被next調用,也可迭代。

三者的包含關係:(可迭代(迭代器(生成器)))

2. Python生成器

python有兩種類型的生成器:生成器表達式和生成器函數。

由於生成器可迭代並且是iterator,因此可以通過for和next進行遍歷。

2.1 生成器表達式

把列表生成式的[]改成()便得到生成器表達式。

>>> gen = (i + i for i in xrange(10))
>>> gen
<generator object <genexpr> at 0x0000000003A2DAB0>
>>> type(gen)
<type 'generator'>
>>> isinstance(gen, types.GeneratorType) and isinstance(gen, collections.Iterator) and isinstance(gen, collections.Iterable)
True
>>> 

2.2 生成器函數

python函數定義中有關鍵字yield,該函數便是一個生成器函數,函數調用返回的是一個generator.

def yield_func():
    for i in xrange(3):
        yield i
gen_func = yield_func()
for yield_val in gen_func:
    print yield_val

生成器函數每次執行到yield便會返回,但與普通函數不同的是yield返回時會保留當前函數的執行狀態,再次被調用時可以從中斷的地方繼續執行。

2.3 next與send

通過for和next可以遍歷生成器,而send則可以用於向生成器函數發送消息。

1 def yield_func():
2     for i in xrange(1, 3):
3         x = yield i
4         print 'yield_func',x
5 gen_func = yield_func()
6 print 'iter result: %d' % next(gen_func)
7 print 'iter result: %d' % gen_func.send(100)

結果:

iter result: 1
yield_func 100
iter result: 2

簡單分析一下執行過程:

  • line_no 5 調用生成器函數yield_func得到函數生成器gen_func;
  • line_no 6 使用next調用gen_func,此時才真正的開始執行yield_func定義的代碼;
  • line_no 3 執行到yield i,函數yield_func暫停執行並返回當前i的值1.
  • line_no 6 next(gen_func)得到函數yield_func執行到yield i返回的值1,輸出結果iter result: 1;
  • line_no 7 執行gen_func.send(100);
  • line_no 3 函數yield_func繼續執行,並將調用者send的值100賦值給x;
  • line_no 4 輸出調用者send接收到的值;
  • line_no 3 執行到yield i,函數yield_func暫停執行並返回當前i的值2.
  • line_no 7 執行gen_func.send(100)得到函數yield_func運行到yield i返回的值2,輸出結果iter result: 2;

如果在上面代碼後面再加一行:

print 'iter result: %d' % next(gen_func)

結果:

iter result: 1
yield_func 100
iter result: 2
yield_func None
File "G:\Cnblogs\Alpha Panda\Main.py", line 22, in <module>
    print 'iter result: %d' % next(gen_func)
StopIteration

 yield_func只會產生2個yield,但是我們迭代調用了3次,會拋出異常StopIteration。

next和send均會觸發生成器函數的執行,使用for遍歷生成器函數時不要用send。原因後面解釋。

2.4 生成器返回值

使用了yield的函數嚴格來講已經不是一個函數,而是一個生成器。因此函數中yield和return是不能同時出現的。

SyntaxError: 'return' with argument inside generator

生成器只能通過yield將每次調用的結果返回給調用者。

2.5 可迭代對象轉成迭代器

list、tuple、dict等可迭代但不是迭代器的對象可通過內置函數iter轉化為iterator,便可以通過next進行遍歷;

這樣的好處是可以統一使用next遍歷所有的可迭代對象;

tup = (1,2,3)
for ele in tup:
    print ele + ele

上面的代碼等價於:

tup_iterator = iter(tup)
while True: try: ele = next(tup_iterator) except StopIteration: break print ele + ele

for迴圈使用next遍歷一個迭代器,混合使用send可能會導致混亂的遍歷流程。

其實到這裡生成器相關的概念基本已經介紹完成了,自己動手過一遍應該能弄明白了。為了更加深刻的體會生成器,下麵我們在往前走一步。

3. range與xrange

在Python 2中這兩個比較常用,看一下兩者的區別:

  • range為一個內置函數,xrange是一個類;
  • 前者返回一個list,後者返回一個可迭代對象;
  • 後者遍歷操作快於前者,且占用更少記憶體;

 這裡xrange有點類似於上面介紹的生成器表達式,雖然xrange返回的並不是生成器,但兩者均返回並不包含全部結果可迭代對象。

3.1 自定義xrange的Iterator版本

作為一個iterator:

The iterator objects themselves are required to support the following two methods, which together form the iterator protocol:

iterator.__iter__()

Return the iterator object itself. This is required to allow both containers and iterators to be used with the for and in statements. This method corresponds to the tp_iter slot of the type structure for Python objects in the Python/C API.

iterator.next()

Return the next item from the container. If there are no further items, raise the StopIteration exception. This method corresponds to the tp_iternext slot of the type structure for Python objects in the Python/C API.

下麵我們自定義class my_xrange:

 1 class my_xrange(object):
 2     def __init__(self, start, stop = None, step = 1):
 3         """ 僅僅為了演示,假設start, stop 和 step 均為正整數 """
 4         self._start = 0 if stop is None else start
 5         self._stop = start if stop is None else stop
 6         self._step = step
 7         self._cur_val = self._start
 8 
 9     def __iter__(self):
10         return self
11 
12     def next(self):
13         if self._start <= self._cur_val < self._stop:
14             cur_val = self._cur_val
15             self._cur_val += self._step
16             return cur_val
17         raise StopIteration

測試結果:

import collections
myxrange = my_xrange(0, 10, 3)
res = []
for val in myxrange:
    res.append(val)
print res == range(0, 10, 3)   # True
print isinstance(myxrange, collections.Iterator)  # True
print isinstance(myxrange, types.GeneratorType)  # False

3.2 使用函數生成器

下麵使用函數生成器定義一個generator版的xrange。

def xrange_func(start, stop, step = 1):
    """ 僅僅為了演示,假設start, stop 和 step 均為正整數 """
    cur_val = start
    while start <= cur_val and cur_val < stop:
        yield cur_val
        cur_val += step
isinstance(myxrange, collections.Iterator) and isinstance(myxrange, types.GeneratorType) is True

上面兩個自定義xrange版本的例子,均說明生成器以及迭代器保留數列生成過程的狀態,每次只計算一個值並返回。這樣只要占用很少的記憶體即可表示一個很大的序列。

4. 應用

不管是迭代器還是生成器,對於有大量有規律的數據產生並需要遍歷訪問的情景均適用,占用記憶體少而且遍歷的速度快。其中一個較為經典的應用為斐波那契數列(Fibonacci sequence)。

這裡以os.walk遍歷目錄為例來說明yield的應用。如果我們需要遍歷一個根目錄下的所有文件並根據需要進行增刪改查。可能會遇到下列的問題:

預先遍歷且緩存結果,但是目錄下文件可能很多,而且會動態改變;如果不緩存,多個地方可能會頻繁的需要訪問這一結果導致效率低下。

 這時候可以使用yield定義一個生成器函數。

def get_all_dir_files(target_dir):
    for root, dirs, files in os.walk(target_dir):
        for file in files:
            file_path = os.path.join(root, file)
            yield os.path.realpath(file_path)

def file_factory(file):
    """ do something """

target_dir = './'
all_files = get_all_dir_files(target_dir)
for file in all_files:
    file_factory(file)

  限於篇幅,就先介紹到這裡,希望本文能讓你對生成器有一個新的認識。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • vue判斷是pc端還是移動端分別進入不同的頁面 判斷移動端代碼如下: 路由判斷分別進入pc還是移動端 判斷路由代碼如下: 通過user-agent值,來進行判斷,使用javascript框架中的Navigator對象的userAgent屬性 還有些其他方法可以根據個人項目是改動,僅個人學習筆記,希望 ...
  • datagrid 實現表格記錄拖拽 by:授客 QQ:1033553122 測試環境 jquery-easyui-1.5.3 jquery-easyui-datagrid-dnd 下載地址: http://www.jeasyui.net/demo/193.html 實現 編輯datagrid-dnd ...
  • 個人博客原文: "創建型模式:抽象工廠" 五大創建型模式之三:抽象工廠。 簡介 姓名 :抽象工廠 英文名 :Abstract Factory Pattern 價值觀 :不管你有多少產品,給我就是了 個人介紹 : Provide an interface for creating families o ...
  • 一、前言 在我們日常工作中,除了Spring和Mybatis外,用到最多無外乎分散式緩存框架——Redis。但是很多工作很多年的朋友對Redis還處於一個最基礎的使用和認識。所以我就像把自己對分散式緩存的一些理解和應用整理一個系列,希望可以幫助到大家加深對Redis的理解。本系列的文章思路先從Red ...
  • 本文講述了一路走來對Session的認知。文章有點長,不過是故事型的,應該不枯燥。相信讀完也一定會有所收穫。 (一) “當你登陸系統後,伺服器會創建一個Session,保存你的登陸信息,下次再訪問時就不需要再登陸。Session可以保存到資料庫里或文件里,必要時可以還原出來。”沒錯,這就是我十幾年前 ...
  • 1. 微醫掛號網專家團隊數據 寫在前面 今天嘗試使用一個新的爬蟲庫進行數據的爬取,這個庫叫做 ,國人開發的,當然支持一下。 github地址: https://github.com/binux/pyspider 官方文檔地址:http://docs.pyspider.org/en/latest/ 安 ...
  • 給數組賦值的方法除了用賦值語句對數組元素逐個賦值外,還可採用初始化賦值和動態賦值的方法。 數組初始化賦值是指在數組定義時給數組元素賦初值。數組初始化是編譯階段進行的。這樣將減少運行時間,提高效率。 註:之前用到的賦值語句或輸入語句給數組賦值是在運行時完成的。 一般形式為:類型說明符 數組名[常量表達 ...
  • centos無法上網問題 虛擬機設置 網段設置 網關設置 查看本地電腦設置 登錄伺服器設置 /etc/sysconfig/network-scripts/ 下麵的 ifcfg-ens33 文件操作如下 [root@localhost ~]# cd /etc/sysconfig/network-scr ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...