Python多進程併發操作中進程池Pool的應用

来源:http://www.cnblogs.com/alan-babyblog/archive/2016/04/03/5351031.html
-Advertisement-
Play Games

在利用Python進行系統管理的時候,特別是同時操作多個文件目錄,或者遠程式控制制多台主機,並行操作可以節約大量的時間。當被操作對象數目不大時,可以直接利用multiprocessing中的Process動態成生多個進程,10幾個還好,但如果是上百個,上千個目標,手動的去限制進程數量卻又太過繁瑣,這時候 ...


  在利用Python進行系統管理的時候,特別是同時操作多個文件目錄,或者遠程式控制制多台主機,並行操作可以節約大量的時間。當被操作對象數目不大時,可以直接利用multiprocessing中的Process動態成生多個進程,10幾個還好,但如果是上百個,上千個目標,手動的去限制進程數量卻又太過繁瑣,這時候進程池Pool發揮作用的時候就到了。
      Pool可以提供指定數量的進程,供用戶調用,當有新的請求提交到pool中時,如果池還沒有滿,

那麼就會創建一個新的進程用來執行該請求;但如果池中的進程數已經達到規定最大值,

那麼該請求就會等待,直到池中有進程結束,

才會創建新的進程來它。這裡有一個簡單的例子:

 

#!/usr/bin/env python
#coding=utf-8


from multiprocessing import Pool
from time import sleep

def f(x):
    for i in range(10):
        print '%s --- %s ' % (i, x)
        sleep(1)


def main():
    pool = Pool(processes=3)    # set the processes max number 3
    for i in range(11,20):
        result = pool.apply_async(f, (i,))
    pool.close()
    pool.join()
    if result.successful():
        print 'successful'


if __name__ == "__main__":
    main()

 

先創建容量為3的進程池,然後將f(i)依次傳遞給它,運行腳本後利用ps aux | grep pool.py查看進程情況,會發現最多只會有三個進程執行。pool.apply_async()用來向進程池提交目標請求,pool.join()是用來等待進程池中的worker進程執行完畢,防止主進程在worker進程結束前結束。但必pool.join()必須使用在pool.close()或者pool.terminate()之後。其中close()跟terminate()的區別在於close()會等待池中的worker進程執行結束再關閉pool,而terminate()則是直接關閉。result.successful()表示整個調用執行的狀態,如果還有worker沒有執行完,則會拋出AssertionError異常。
    利用multiprocessing下的Pool可以很方便的同時自動處理幾百或者上千個並行操作,腳本的複雜性也大大降低.

 

python中multiprocessing.pool函數介紹

 

apply(func[, args[, kwds]])
   apply用於傳遞不定參數,同python中的apply函數一致(不過內置的apply函數從2.3以後就不建議使用了),主進程會阻塞於函數。
for x in gen_list(l):
    result = pool.apply(pool_test, (x,))
    print 'main process'
這個時候主進程的執行流程同單進程一致
apply_async(func[, args[, kwds[, callback]]])
   與apply用法一致,但它是非阻塞的且支持結果返回後進行回調。
for x in gen_list(l):
    result = pool.apply_async(pool_test, (x,))
    print 'main process'
   這個時候主進程迴圈運行過程中不等待apply_async的返回結果,在主進程結束後,即使子進程還未返回整個程式也會就退出。雖然 apply_async是非阻塞的,但其返回結果的get方法卻是阻塞的,在本例中result.get()會阻塞主進程。因此可以這樣來處理返回結果:
    [x.get() for x in [pool.apply_async(pool_test, (x,)) for x in gen_list(l)]]
如果我們對返回結果不感興趣, 那麼可以在主進程中使用pool.close與pool.join來防止主進程退出。註意join方法一定要在close或terminate之後調用。
    for x in gen_list(l):
    pool.apply_async(pool_test, (x, ))
    print 'main_process'
    pool.close()
    pool.join()
map(func, iterable[, chunksize])
   map方法與內置的map函數行為基本一致,在它會使進程阻塞與此直到結果返回。
   但需註意的是其第二個參數雖然描述的為iterable, 但在實際使用中發現只有在整個隊列全部就緒後,程式才會運行子進程。
map_async(func, iterable[, chunksize[, callback]])
   與map用法一致,但是它是非阻塞的。其有關事項見apply_async。
imap(func, iterable[, chunksize])
   與map不同的是, imap的返回結果為iter,需要在主進程中主動使用next來驅動子進程的調用。即使子進程沒有返回結果,主進程對於gen_list(l)的 iter還是會繼續進行, 另外根據python2.6文檔的描述,對於大數據量的iterable而言,將chunksize設置大一些比預設的1要好。
   for x in pool.imap(pool_test, gen_list(l)):
       pass
imap_unordered(func, iterable[, chunksize])
   同imap一致,只不過其並不保證返回結果與迭代傳入的順序一致。
close()
   關閉pool,使其不在接受新的任務。
terminate()
   結束工作進程,不在處理未處理的任務。
join()
   主進程阻塞等待子進程的退出, join方法要在close或terminate之後使用。

 

l = range(10)
def gen_list(l):
    for x in l:
        print 'yield', x
        yield x

def pool_test(x):
    print 'f2', x
    time.sleep(1)

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這學期我們學操作系統,所以得寫個PCB。 於是我借鑒了一下windows的PCB,寫了這個 那個SingleLinkedList是我自定義的 ...
  • list也就是列表的意思,可以存儲一組數據集合,比如classmates=['zhangsan','lisi','123']每個數據用單引號包裹,逗號隔開。 list是一個有序列表,可以向其中添加單元,在末尾追加 一個數據classmates.append('Adam'),也可以在任意位置添加數據, ...
  • 方法表集合 前面的魔數,次版本號,主板本號,常量池入口,常量池,訪問標誌,類索引,父類索引,介面索引集合,欄位表集合,那麼再接下來就是方法表了. 方法表集合 前面的魔數,次版本號,主板本號,常量池入口,常量池,訪問標誌,類索引,父類索引,介面索引集合,欄位表集合,那麼再接下來就是方法表了. 方法表的 ...
  • 談起C++中的巨集,我們第一個想到的應該就是“#define”,它的基本語法長得像這樣: 巨集的聲明和普通的函數聲明很像,但是兩者之間有本質的區別:C++函數在運行時(runtime)才執行代碼段;而巨集則是在預編譯時期(preprocessor)執行代碼段。下麵簡單介紹一下幾個巨集的應用。 一、考慮下麵的 ...
  • retrofit:一套RESTful架構的Android(Java)客戶端實現。 好處: 基於註解 提供JSON to POJO,POJO to JSON,網路請求(POST,GET,PUT,DELETE等)封裝 可以看做是對HttpClient的再次封裝 1、為了做測試,建立了一個新的spring ...
  • 協程,又稱微線程,纖程。英文名Coroutine。單進程的非同步編程模型稱為協程,有了協程的支持,就可以基於事件驅動編寫高效的多任務程式 協程的概念很早就提出來了,但直到最近幾年才在某些語言(如Lua)中得到廣泛應用。 子程式,或者稱為函數,在所有語言中都是層級調用,比如A調用B,B在執行過程中又調用 ...
  • 假設當前表結構如下: food表欄位有foodid,name,外鍵businessid,外鍵type business表欄位有,name,外鍵type type表欄位有id,name,foodid Hibernate生成的對應POJO分別是Food,Business,Type 需要查詢food表部分 ...
  • 我們在升級系統的時候,經常碰到需要更新伺服器端數據結構等操作,之前的方式是通過手工編寫alter sql腳本處理,經常會發現遺漏,導致程式發佈到伺服器上後無法正常使用。 現在我們可以使用Flask-Migrate插件來解決之,Flask-Migrate插件是基於Alembic,Alembic是由大名 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...