Python開發【筆記】:concurrent.futures 平行運算

来源:http://www.cnblogs.com/lianzhilei/archive/2017/08/04/7278956.html
-Advertisement-
Play Games

平行運算 前言: 編寫Python程式時,我們可能會遭遇性能問題,即使優化了代碼,程式也依然有可能運行的很慢,從而無法滿足我們對執行速度的要求,目前的電腦,其cpu核心數越來越多,於是,我們可以考慮通過平行計算來提升性能,能不能把代碼的總計算量分配到多個獨立的任務之中,併在多個CPU核心上面同時運 ...


平行運算

前言:

  編寫Python程式時,我們可能會遭遇性能問題,即使優化了代碼,程式也依然有可能運行的很慢,從而無法滿足我們對執行速度的要求,目前的電腦,其cpu核心數越來越多,於是,我們可以考慮通過平行計算來提升性能,能不能把代碼的總計算量分配到多個獨立的任務之中,併在多個CPU核心上面同時運行這些任務呢?

  很遺憾,Python的全局解釋器鎖(GIL)使得我們沒有辦法用線程實現真正的平行計算,因此,上面那個想法行不通。另外一種常見的建議,是用C語言把程式中對性能要求較高的那部分代碼,改為擴展模塊,由於C語言更貼近硬體,所以運行的比Python快,一旦運行速度達到要求,我們自然就不用再考慮平行計算了,C語言擴展也可以啟動並並行地運行多個原聲線程,從而充分利用CPU的多個內核。Python中的C語言擴展API,有完備的文檔可供查閱,這使得它成為解決性能問題的一個好辦法。

  但是,用C語言重寫代碼,是有很大代價的,短小而易讀的Python代碼,會變成冗長而費解的C代碼,在進行這樣的移植時,必須進行大量的測試,確保移植過程中沒有引入bug。然而問題在於:只把程式中的一小部分遷移到C,通常是不夠的。一般來說,Python程式之所以執行得比較慢,並不是某個主要因素單獨造成的,而是多個因素聯合導致的,所以,要想充分利用C語言的硬體和線程優勢,就必須把程式中的大量代碼移植到C,而這樣做,有大幅增加了測試量和風險。於是,我們應該思考一下:有沒有一種更好的方式,只需要使用較少的Python代碼,即可有效提升執行速度,並迅速解決複雜的計算問題。

  我們可以試著通過內置的concurrent.futures模塊,來利用另外一個名叫multiprocessing的內置模塊,從而實現這種需求,該做法會以子進程的形式,平行地運行多個解釋器,從而令Python程式能夠利用多核心CPU提升執行速度,由於子進程與主解釋器相分離,所以它們的全局解釋器鎖也是相互獨立的,每個紫禁城都可以完整地利用一個CPU內核,而且這些自經常,都與主進程之間有著聯繫,通過這條聯繫渠道,紫禁城可以接收主進程發過來的指令,並把計算結果返回給主進程

 

程式運算:

  編寫運算量很大的Python程式,查找兩數最大公約數,用三種不同的方式進行對比

 單線程

代碼:

# 單線程
import time

def gcd(pair):
    a,b = pair
    low = min(a,b)
    for i in range(low,0,-1):
        if a % i == 0 and b % i == 0:
            return i

numbers = [(89937224,53452411),(97432894,43939284),(95938272,94910833),
           (7398473,47382942),(85938272,90493759)]
start = time.time()
results = list(map(gcd,numbers))
end = time.time()
print('Took %.3f secondes'%(end-start))

執行結果:

Took 22.083 secondes

多線程

代碼:

# 多線程
import time
from concurrent.futures import ThreadPoolExecutor

def gcd(pair):
    a,b = pair
    low = min(a,b)
    for i in range(low,0,-1):
        if a % i == 0 and b % i == 0:
            return i

numbers = [(89937224,53452411),(97432894,43939284),(95938272,94910833),
           (7398473,47382942),(85938272,90493759)]
start = time.time()
pool = ThreadPoolExecutor(max_workers=2)
results = list(pool.map(gcd,numbers))
end = time.time()
print('Took %.3f secondes'%(end-start))

執行結果:

Took 25.338 secondes

註:用多條Python現場來改善上述程式,是沒有效果的,因為全局解釋器鎖(GIL)使得Python無法在多個CPU核心上面平行地運行這些線程。線程啟動的時候,是有一定開銷的,與線程池進行通信,也會有開銷,所以上面這個程式運行的比單線程版本還要滿

多進程(只能linux下運行)

我們只需要改動一行代碼,就可以提升整個程式的速度,把ThreadPoolExecutor換成concurrent.futures模塊里的ProcessPoolExecutor,程式的速度就上去了

代碼:

import time
from concurrent.futures import ProcessPoolExecutor
from multiprocessing import cpu_count

def gcd(pair):
    a,b = pair
    low = min(a,b)
    for i in range(low,0,-1):
        if a % i == 0 and b % i == 0:
            return i

numbers = [(89937224,53452411),(97432894,43939284),(95938272,94910833),
           (7398473,47382942),(85938272,90493759)]
start = time.time()
pool = ProcessPoolExecutor(max_workers=cpu_count())  # 四核
results = list(pool.map(gcd,numbers))
end = time.time()
print('Took %.3f secondes'%(end-start))

執行結果:

Took 6.816 secondes

註:果然比前面兩個版本的程式執行速度快了很多

 

總結:

ProcessPoolExecutor類利用由multiprocessing模塊所提供的底層機制,來逐步完成下列操作:

 

  • 把numbers列表中的每一項輸入數據都傳給map。
  • 用pickle模塊對數據進行序列化,將其變成二進位形式。
  • 通過本地套接字(local socket),將序列化之後的數據從主解釋器所在的進程,發到子解釋器所在的進程。
  • 接下來,在子進程中,用pickle對二進位數據進行反序列化操作,將其還原為Python對象。
  • 引入包含gcd函數的那個Python模塊。
  • 各條子進程平行地針對各自的輸入數據,來運行gcd函數。
  • 對運行結果進行序列化操作,將其轉變為位元組。
  • 將這些位元組通過socket負責到主進程之中。
  • 主進程對這些位元組執行反序列話操作,將其還原為Python對象。
  • 最後,把每條子進程所求出的計算結果合併到一份列表之中,並返回給調用者

  從編程者的角度看,上面的這些步驟,似乎是比較簡單的,但實際上,為了實現平行計算,mutiprocessing模塊和ProcessPoolExecutor類在幕後做了大量的工作,如果改用其他編程語言來寫,那麼開發者只需要用一把同步鎖或一項原子操作,就可以把線程之間的同學過程協調好,而在Python語言中,我們卻必須使用開銷較高的multiprocessing模塊,mutiproocessing的開銷之所以比較大,原因在於:主進程和子進程之間,必須進行序列化和反序列化操作,而程式中的大量開銷,正式由這些操作所引發的。

  對於某些較為孤立,且數據利用率較高的任務來說,這套方案非常合適。所謂孤立,是指待運行的函數不需要與程式中的其他部分共用狀態。所謂利用率高,是指只需要在主進程和紫禁城之間傳遞一部分數據,就能完成大量的運算。本例中的最大公約數演算法,滿足這兩個條件,其他的一些類似數學演算法,也可以通過這套方案實現平行計算。

  


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 貼一下自己序列化的代碼: 上面的寫法持續序列化不會有記憶體溢出的性能問題,之前一直被告知直接引用公司某位老鳥封裝好的dll來序列化,後來發現了老是出現記憶體溢出,貼一下它的錯誤寫法,僅供吸取教訓: 哎,老鳥趕時間的時候寫代碼都這麼隨意嗎?看到被註釋掉的try catch我猜測他曾經也覺得這裡有問題,不過 ...
  • 其實我也不知道如何定義這個標題,詞乏,姑且先這樣定義吧。 看了本文章的朋友,如果有更好標題,請告訴我,謝謝。 有個項目使用SDK時遇到這樣一個情況。 該SDK有個BtPrinterManager類,擁有兩個方法:ServerPrint和ClientPrint,這兩個方法有一部分參數是一樣的,一部分參 ...
  • 新建Model1.edmx文件 頁面引用資料庫Model1 如下創建AD資料庫的model文件、 找到以下菜單 找到所需要引用資料庫類名稱。 在頁面後臺引用 ...
  • 大家可能在項目中,有的時候,由於顯示的內容過長,所以,需要顯示一部分內容,然後後面用省略號,把滑鼠放上去,會顯示出來全部的內容。 作為一個LowB程式員的我,第一反應是SubString截取,然後替換,然後ToolTip顯示原有的內容。 我相信很大一部分的初級程式員第一想法也是這個,然而,這種方法不 ...
  • using System.IO; System.Windows.Forms.SaveFileDialog objSave = new System.Windows.Forms.SaveFileDialog();objSave.Filter = "(*.txt)|*.txt|" + "(*.*)|*. ...
  • Java連接MySQL資料庫增刪改查通用方法 運行環境:eclipse+MySQL 以前我們Java連接MySQL資料庫都是一個資料庫寫一個類,類下麵寫好多方法,要是多個資料庫,就要寫多個類多個方法,導致代碼編寫太過於繁瑣,所以為了改變這樣的繁瑣,我將連接資料庫的方法進行了一系列的封裝,使用戶傳入一 ...
  • 心血來潮想瞭解下常用圖片的格式解析,翻看了一些資料後,發現最簡單的是bmp格式,所以先拿它開刀。 BMP格式 這種格式內的數據分為 三到四個 部分,依次是: 1. 文件信息頭 (14位元組)存儲著文件類型,文件大小等信息 2. 圖片信息頭 (40位元組)存儲著圖像的尺寸,顏色索引,位平面數等信息 3. ...
  • 操作系統 : CentOS7.3.1611_x64 python版本:2.7.5 sklearn版本:0.18.2 tensorflow版本 :1.2.1 多項式的定義及展現形式 多項式(Polynomial)是代數學中的基礎概念,是由稱為不定元的變數和稱為繫數的常數通過有限次加減法、乘法以及自然數 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...