Python 併發編程:PoolExecutor 篇

来源:https://www.cnblogs.com/kirito-c/archive/2019/03/15/10299679.html
-Advertisement-
Play Games

個人筆記,如有疏漏,還請指正。 使用多線程(threading)和多進程(multiprocessing)完成常規的併發需求,在啟動的時候 start、join 等步驟不能省,複雜的需要還要用 1 2 個隊列。 隨著需求越來越複雜,如果沒有良好的設計和抽象這部分的功能層次,代碼量越多調試的難度就越大 ...


個人筆記,如有疏漏,還請指正。

使用多線程(threading)和多進程(multiprocessing)完成常規的併發需求,在啟動的時候 start、join 等步驟不能省,複雜的需要還要用 1-2 個隊列。
隨著需求越來越複雜,如果沒有良好的設計和抽象這部分的功能層次,代碼量越多調試的難度就越大。

對於需要併發執行、但是對實時性要求不高的任務,我們可以使用 concurrent.futures 包中的 PoolExecutor 類來實現。

這個包提供了兩個執行器:線程池執行器 ThreadPoolExecutor 和進程池執行器 ProcessPoolExecutor,兩個執行器提供同樣的 API。

池的概念主要目的是為了重用:讓線程或進程在生命周期內可以多次使用。它減少了創建創建線程和進程的開銷,提高了程式性能。重用不是必須的規則,但它是程式員在應用中使用池的主要原因。

池,只有固定個數的線程/進程,通過 max_workers 指定。

  1. 任務通過 executor.submit 提交到 executor 的任務隊列,返回一個 future 對象。
    • Future 是常見的一種併發設計模式。一個Future對象代表了一些尚未就緒(完成)的結果,在「將來」的某個時間就緒了之後就可以獲取到這個結果。
  2. 任務被調度到各個 workers 中執行。但是要註意,一個任務一旦被執行,在執行完畢前,會一直占用該 worker!
    • 如果 workers 不夠用,其他的任務會一直等待!因此 PoolExecutor 不適合實時任務。
import concurrent.futures
import time
from itertools import count

number_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

def evaluate_item(x):
    for i in count(x):  # count 是無限迭代器,會一直遞增。
        print(f"{x} - {i}")
        time.sleep(0.01)


if __name__ == "__main__":
        # 進程池
        start_time_2 = time.time()

        # 使用 with 在離開此代碼塊時,自動調用 executor.shutdown(wait=true) 釋放 executor 資源
        with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
                # 將 10 個任務提交給 executor,並收集 futures
                futures = [executor.submit(evaluate_item, item) for item in number_list]

                # as_completed 方法等待 futures 中的 future 完成
                # 一旦某個 future 完成,as_completed 就立即返回該 future
                # 這個方法,使每次返回的 future,總是最先完成的 future
                # 而不是先等待任務 1,再等待任務 2...
                for future in concurrent.futures.as_completed(futures):
                        print(future.result())
        print ("Thread pool execution in " + str(time.time() - start_time_2), "seconds")

上面的代碼中,item 為 1 2 3 4 5 的五個任務會一直占用所有的 workers,而 6 7 8 9 10 這五個任務會永遠等待!!!

API 詳細說明

concurrent.futures 包含三個部分的 API:

  1. PoolExecutor:也就是兩個執行器的 API
    • 構造器:主要的參數是 max_workers,用於指定線程池大小(或者說 workers 個數)
    • submit(fn, *args, **kwargs):將任務函數 fn 提交到執行器,args 和 kwargs 就是 fn 需要的參數。
      • 返回一個 future,用於獲取結果
    • map(func, *iterables, timeout=None, chunksize=1):當任務是同一個,只有參數不同時,可以用這個方法代替 submit。iterables 的每個元素對應 func 的一組參數。
      • 返回一個 futures 的迭代器
    • shutdown(wait=True):關閉執行器,一般都使用 with 管理器自動關閉。
  2. Future:任務被提交給執行器後,會返回一個 future
    • future.result(timout=None)最常用的方法,返回任務的結果。如果任務尚未結束,這個方法會一直等待!
      • timeout 指定超時時間,為 None 時沒有超時限制。
    • exception(timeout=None):給出任務拋出的異常。和 result() 一樣,也會等待任務結束。
    • cancel():取消此任務
    • add_done_callback(fn):future 完成後,會執行 fn(future)
    • running():是否正在運行
    • done():future 是否已經結束了,boolean
    • ...詳見官方文檔
  3. 模塊帶有的實用函數
    • concurrent.futures.as_completed(fs, timeout=None):等待 fs (futures iterable)中的 future 完成
      • 一旦 fs 中的某 future 完成了,這個函數就立即返回該 future。
      • 這個方法,使每次返回的 future,總是最先完成的 future。而不是先等待任務 1,再等待任務 2...
      • 常通過 for future in as_completed(fs): 使用此函數。
    • concurrent.futures.wait(fs, timeout=None, return_when=ALL_COMPLETED):一直等待,直到 return_when 所指定的事發生,或者 timeout
      • return_when 有三個選項:ALL_COMPLETED(fs 中的 futures 全部完成),FIRST__COMPLETED(fs 中任意一個 future 完成)還有 FIRST_EXCEPTION(某任務拋出異常)

Future 設計模式

這裡的 PoolExecutor 的特點,在於它使用了 Future 設計模式,使任務的執行,與結果的獲取,變成一個非同步的流程。
我們先通過 submit/map 將任務放入任務隊列,這時任務就已經開始執行了!然後我們在需要的時候,通過 future 獲取結果,或者直接 add_done_callback(fn)

這裡任務的執行是在新的 workers 中的,主進程/線程不會阻塞,因此主線程可以乾其他的事。這種方式被稱作非同步編程。

畫外

concurrent.futures 基於 multiprocessing.pool 實現,因此實際上它比直接使用 線程/進程 的 Pool 要慢一點。但是它提供了更方便簡潔的 API。

參考


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.傳統方式 >原型鏈 (過多繼承了沒用的屬性) Grand.prototype.lastname = 'zhang' function Grand(); } var grand = new Grand(); Father.prototype = grand; function Father(){ ...
  • 什麼是BOM? bom即browser object model 也就是瀏覽器對象模型,BOM由多個對象組成,其中代表瀏覽器視窗的window對象是BOM的頂層對象,其他對象都是該對象的子對象。 頂層對象:window 子對象:location:location 對象包含有關當前 URL 的信息; ...
  • 概述 Prometheus的主要特點 組件 結構圖 適用場景 不適用場景 安裝node_exporter,系統性能指數收集(收集系統性能情況) 下載文件 解壓並複製node_exporter應用程式到/usr/local/bin 清理下載的文件和解壓的文件夾 添加自啟動服務 添加服務配置文件 寫入配 ...
  • 都說三十而立,但現在三十成了程式員的一道坎,如果近年來你有過求職的經歷,或是你關註過智聯、前程、獵聘等招聘平臺,你會發現平臺上數以萬計的招聘信息都會要求應聘者年齡在35歲以內,對於部分科技類初創企業,公司寧願放寬教育程度的要求。也就是說,如果你的年齡大於30歲,那就不要費神來申請了,因為你很可能在自 ...
  • 一、什麼是面向對象 在用面向對象思想寫代碼之前,先瞭解一下什麼是面向對象? 個人理解: 面向對象:把現實世界里的具體物體或者邏輯世界的邏輯物體,用抽象手段,把這些物體抽象成程式能夠識別的類,使類具備物體的屬性和行為,把物體與物體之間的關聯轉換成類與類之間的關聯,用編程邏輯把這些關聯表示出來設計成程式 ...
  • import java.util.Scanner;public class Main{public static void main(String[] args) {int maxn=1000000+5;int mod=10007;int[] Fibonacci=new int[maxn];Fibo ...
  • Python描述符的使用 前言 作為一位python的使用者,你可能使用python有一段時間了,但是對於python中的描述符卻未必使用過,接下來是對描述符使用的介紹 場景介紹 為了引入描述符的使用,我們先設計一個非常簡單的類: class Product(): def __init__(self ...
  • 加密視頻 在以後的開發項目中,很可能有做線上視頻的,而線上視頻就有個問題,因為線上播放,就很有可能視頻數據被抓包,如果這個線上視頻平臺有付費視頻的話,這樣就會有人做點倒賣視頻的生意了,針對這個問題,目前國內有很多不錯的加密視頻平臺,可以把你平臺的視頻放在他們那裡,然後通過他們的機制進行加密,然後做一... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...