在python中實現使用迭代生成器yield減少記憶體占用的方法

来源:https://www.cnblogs.com/python1111/archive/2023/06/30/17517043.html
-Advertisement-
Play Games

在python編碼中for迴圈處理任務時,會將所有的待遍歷參量載入到記憶體中。其實這本沒有必要,因為這些參量很有可能是一次性使用的,甚至很多場景下這些參量是不需要同時存儲在記憶體中的,這時候就會用到本文所介紹的迭代生成器yield。 ### 1.基本使用 首先我們用一個例子來演示一下迭代生成器yield ...


在python編碼中for迴圈處理任務時,會將所有的待遍歷參量載入到記憶體中。其實這本沒有必要,因為這些參量很有可能是一次性使用的,甚至很多場景下這些參量是不需要同時存儲在記憶體中的,這時候就會用到本文所介紹的迭代生成器yield。

1.基本使用

首先我們用一個例子來演示一下迭代生成器yield的基本使用方法,這個例子的作用是構造一個函數用於生成一個平方數組$02,12,2^2...$。

在普通的場景中我們一般會直接構造一個空的列表,然後將每一個計算結果填充到列表中,最後return列表即可,對應的是這裡的函數square_number。而另外一個函數square_number_yield則是為了演示yield而構造的函數,其使用語法跟return是一樣的,不同的是每次只會返回一個值:

def square_number(length):
    s = []
    for i in range(length):
        s.append(i ** 2)
    return s
 
def square_number_yield(length):
    for i in range(length):
        yield i ** 2
 
if __name__ == '__main__':
    length = 10
    sn1 = square_number(length)
    sn2 = square_number_yield(length)
    for i in range(length):
        print (sn1[i], '\t', end='')
        print (next(sn2))

在main函數中我們對比了兩種方法執行的結果,列印在同一行上面,用end=''指令可以替代行末的換行符號,具體執行的結果如下所示:

[dechin@dechin-manjaro yield]$ python3 test_yield.py 
0       0
1       1
4       4
9       9
16      16
25      25
36      36
49      49
64      64
81      81

可以看到兩種方法列印出來的結果是一樣的。也許有些場景下就是需要持久化的存儲函數中返回的結果,這一點用yield也是可以實現的,可以參考如下示例:

def square_number(length):
    s = []
    for i in range(length):
        s.append(i ** 2)
    return s
 
def square_number_yield(length):
    for i in range(length):
        yield i ** 2
 
if __name__ == '__main__':
    length = 10
    sn1 = square_number(length)
    sn2 = square_number_yield(length)
    sn3 = list(square_number_yield(length))
    for i in range(length):
        print (sn1[i], '\t', end='')
        print (next(sn2), '\t', end='')
        print (sn3[i])

這裡使用的方法是直接將yield生成的對象轉化成list格式,或者用sn3 = [i for i in square_number_yield(length)]這種寫法也是可以的,在性能上應該差異不大。

上述代碼的執行結果如下:

[dechin@dechin-manjaro yield]$ python3 test_yield.py 
0       0       0
1       1       1
4       4       4
9       9       9
16      16      16
25      25      25
36      36      36
49      49      49
64      64      64
81      81      81

2.進階測試

在前面的章節中我們提到,使用yield可以節省程式的記憶體占用,這裡我們來測試一個100000大小的隨機數組的平方和計算。如果使用正常的邏輯,那麼寫出來的程式就是如下所示

import tracemalloc
import time
import numpy as np
tracemalloc.start()
 
start_time = time.time()
ss_list = np.random.randn(100000)
s = 0
for ss in ss_list:
    s += ss ** 2
end_time = time.time()
print ('Time cost is: {}s'.format(end_time - start_time))
 
snapshot = tracemalloc.take_snapshot()
top_stats = snapshot.statistics('lineno')
 
for stat in top_stats[:5]:
    print (stat)

這個程式一方面通過time來測試執行的時間,另一方面利用tracemalloc追蹤程式的記憶體變化。這裡是先用np.random.randn()直接產生了100000個隨機數的數組用於計算,那麼自然在計算的過程中需要存儲這些生成的隨機數,就會占用這麼多的記憶體空間。如果使用yield的方法,每次只產生一個用於計算的隨機數,並且按照上一個章節中的用法,這個迭代生成的隨機數也是可以轉化為一個完整的list的:

import tracemalloc
import time
import numpy as np
tracemalloc.start()
 
start_time = time.time()
def ss_list(length):
    for i in range(length):
        yield np.random.random()
 
s = 0
ss = ss_list(100000)
for i in range(100000):
    s += next(ss) ** 2
end_time = time.time()
print ('Time cost is: {}s'.format(end_time - start_time))
 
snapshot = tracemalloc.take_snapshot()
top_stats = snapshot.statistics('lineno')
 
for stat in top_stats[:5]:
    print (stat)

這兩個示例的執行結果如下,可以放在一起進行對比:

[dechin@dechin-manjaro yield]$ python3 square_sum.py 
Time cost is: 0.24723434448242188s
square_sum.py:9: size=781 KiB, count=2, average=391 KiB
square_sum.py:12: size=24 B, count=1, average=24 B
square_sum.py:11: size=24 B, count=1, average=24 B
[dechin@dechin-manjaro yield]$ python3 yield_square_sum.py 
Time cost is: 0.23023390769958496s
yield_square_sum.py:9: size=136 B, count=1, average=136 B
yield_square_sum.py:14: size=112 B, count=1, average=112 B
yield_square_sum.py:11: size=79 B, count=2, average=40 B
yield_square_sum.py:10: size=76 B, count=2, average=38 B
yield_square_sum.py:15: size=28 B, count=1, average=28 B

經過比較我們發現,兩種方法的計算時間是幾乎差不多的,但是在記憶體占用上yield有著明顯的優勢。當然,也許這個例子並不是非常的恰當,但是本文主要還是介紹yield的使用方法及其應用場景。

3.無限長迭代器

在參考鏈接1中提到了一種用法是無限長的迭代器,比如按順序返回所有的素數,那麼此時我們如果用return來返回所有的元素並存儲到一個列表裡面,就是一個非常不經濟的辦法,所以可以使用yield來迭代生成,參考鏈接1中的源代碼如下所示:

'''
學習中遇到問題沒人解答?小編創建了一個Python學習交流群:711312441
尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書!
'''
def get_primes(number):
    while True:
        if is_prime(number):
            yield number

        number += 1

那麼類似的,這裡我們用while True可以展示一個簡單的案例——返回所有的偶數:

def yield_range2(i):
    while True:
        yield i
        i += 2
 
iter = yield_range2(0)
for i in range(10):
    print (next(iter))

因為這裡我們限制了長度是10,所以最終會返回10個偶數:

[dechin@dechin-manjaro yield]$ python3 yield_iter.py 
0
2
4
6
8
10
12
14
16
18

4.總結

本文介紹了python的迭代器yield,其實關於yield,我們可以簡單的將其理解為單個元素的return。這樣不僅就初步理解了yield的使用語法,也能夠大概瞭解到yield的優勢,也就是在計算過程中每次只占用一個元素的記憶體,而不需要一直存儲大量的元素在記憶體中。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ![](https://img2023.cnblogs.com/blog/3076680/202306/3076680-20230628115834099-2000661347.png) # 1. 握手 ## 1.1. 發送方和接收方之間的信號傳遞過程 ## 1.2. 模擬數據機使用一種握手形式 ...
  • ### 歡迎訪問我的GitHub > 這裡分類和彙總了欣宸的全部原創(含配套源碼):[https://github.com/zq2599/blog_demos](https://github.com/zq2599/blog_demos) ### 本篇概覽 - 本文是《JavaCV的攝像頭實戰》系列的 ...
  • 某日二師兄參加XXX科技公司的C++工程師開發崗位第30面: > 面試官:什麼是空指針? > > 二師兄:一般我們將等於`0`/`NULL`/`nullptr`的指針稱為空指針。空指針不能被解引用,但是可以對空指針取地址。 ```c++ int* p = nullptr; //空指針 *p = 42 ...
  • #String解析及其方法 1.[前言](#jump1) 2.[什麼是字元串(String)](#jump2) 3.[字元串(String)的兩種創建方式及其區別](#jump3) 4.[字元串(String)的方法及其部分原碼解析](#jump4) 5.[字元串(String)的弊端](#jump ...
  • 業務數據的存儲,少不了數據記錄的id序列,id序列(或稱序列)的生成方式有很多種,比如當前時間戳、資料庫的序列值(Oracle的序列,MySQL的自增ID等)、UUID等方式,但這些生成方式均存在一定的局限性,本文介紹一種通用高性能的分散式id序列的設計思路…… ...
  • > JDK8 > > 複習用 ## Java前置知識 1. JavaSE Java Standard Edition 標準版 支持面向桌面級應用(如Windows下的應用程式)的 Java平臺,提供了完整的Java核心API 此版本以前稱為 J2SE 2. JavaEE Java Enterpris ...
  • 路由計算服務是路由系統的核心服務,負責運單路由計劃的計算以及實操與計劃的匹配。在運維過程中,發現在長期不重啟的情況下,有TP99緩慢爬坡的現象。此外,在每周例行調度的試算過程中,能明顯看到記憶體的上漲。 ...
  • dperf 是一款基於 DPDK 的 100Gbps 網路性能和負載測試軟體,能夠每秒建立千萬級的 HTTP 連接、億級別的併發請求和數百 Gbps 的吞吐量。 ## 優點 ### 性能強大: - 基於 DPDK,使用一臺普通 x86 伺服器就可以產生巨大的流量:千萬級的 HTTP 每秒新建連接數, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...