使用concurrent.futures模塊中的線程池與進程池 線程池與進程池 以線程池舉例,系統使用多線程方式運行時,會產生大量的線程創建與銷毀,創建與銷毀必定會帶來一定的消耗,甚至導致系統資源的崩潰,這時使用線程池就是一個很好的解決方式。 “池”就說明瞭這裡邊維護了不止一個線程,線程池會提前創建 ...
使用concurrent.futures模塊中的線程池與進程池
線程池與進程池
以線程池舉例,系統使用多線程方式運行時,會產生大量的線程創建與銷毀,創建與銷毀必定會帶來一定的消耗,甚至導致系統資源的崩潰,這時使用線程池就是一個很好的解決方式。
“池”就說明瞭這裡邊維護了不止一個線程,線程池會提前創建好規定數量的線程,把需要使用多線程的任務提交給線程池,線程池會自己選擇空閑的線程來執行提交的任務,任務完成後,線程並不會在池子中銷毀,而是繼續存在並等待完成下一個分配的任務。當線程池以滿的時候,提交的線程會等待,也就是說線程池會有一個最大數量的運行線程限制。
進程池同樣也是這個道理。
concurrent.futures模塊為我們提供了ThreadPoolExecutor與ProcessPoolExecutor來使用線程進程池
ThreadPoolExecutor
下麵是一個簡單的例子
from concurrent.futures import ThreadPoolExecutor
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
pool = ThreadPoolExecutor(max_workers=3)
start = time.time()
for url in url_list:
future = pool.submit(get_url,url)
# print(future)
end = time.time()
print(end-start)
輸出的結果為:
0.0016434192657470703
https://www.cnblogs.com/已獲取
https://www.csdn.net/已獲取
https://github.com/已獲取
例子中max_workers為指定線程個數,pool.submit為提交任務到線程執行,get_url為方法,url為參數
並且通過輸出順序可以看到線程池的執行並不會阻塞主線程的運行
print(future)被打了註釋,現在我們取消註釋運行一下:
Future at 0x7ff6cfaa8860 state=running
Future at 0x7ff6ce965860 state=running
Future at 0x7ff6ce96e278 state=running
0.006175518035888672
https://www.cnblogs.com/已獲取
https://www.csdn.net/已獲取
https://github.com/已獲取
每提交一個任務後都會返回一個future對象,通過它可以查看任務運行的狀態,state=running表示正在運行
future對象還有許多方法:
future.done()
from concurrent.futures import ThreadPoolExecutor
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
pool = ThreadPoolExecutor(max_workers=3)
future_list = []
start = time.time()
for url in url_list:
future = pool.submit(get_url,url)
print(future.done())
future_list.append(future)
end = time.time()
print(end-start)
time.sleep(5)
for future in future_list:
print(future.done())
這裡添加了future_list,為了顯示效果中間添加sleep,最後結果為:
False
False
False
0.001546621322631836
https://www.cnblogs.com/已獲取
https://www.csdn.net/已獲取
https://github.com/已獲取
True
True
True
future.done()可以顯示當前允許狀態
future.result()
from concurrent.futures import ThreadPoolExecutor
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
return url
pool = ThreadPoolExecutor(max_workers=3)
future_list = []
start = time.time()
for url in url_list:
future = pool.submit(get_url,url)
print(future.result())
future_list.append(future)
end = time.time()
print(end-start)
for future in future_list:
print(future.result())
結果為:
https://www.cnblogs.com/已獲取
https://www.cnblogs.com/
https://www.csdn.net/已獲取
https://www.csdn.net/
https://github.com/已獲取
https://github.com/
2.0975613594055176
https://www.cnblogs.com/
https://www.csdn.net/
https://github.com/
可見result()方法可以得到任務的返回值,但會阻塞,因為不運行完怎麼會得到返回值呢?
除此之外還有很多方法:
使用map方法
from concurrent.futures import ThreadPoolExecutor
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
return url
pool = ThreadPoolExecutor(max_workers=3)
pool.map(get_url,url_list)
與內建函數用法類似
使用wait方法
from concurrent.futures import ThreadPoolExecutor,wait
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
return url
pool = ThreadPoolExecutor(max_workers=3)
future_list = []
start = time.time()
for url in url_list:
future = pool.submit(get_url,url)
future_list.append(future)
print(wait(future_list))
end = time.time()
print(end-start)
https://www.cnblogs.com/已獲取
https://www.csdn.net/已獲取
https://github.com/已獲取
DoneAndNotDoneFutures(done={Future at 0x7f7506447da0 state=finished returned str, Future at 0x7f75074c9828 state=finished returned str, Future at 0x7f75064477f0 state=finished returned str}, not_done=set())6.678021430969238
wait返回值是一個元組,元組裡是已完成和未完成的兩個集合,它的return_when參數接受3個選項FIRST_COMPLETED, FIRST_EXCEPTION 和ALL_COMPLETE,預設是ALL_COMPLETE,意味著所有都完成,FIRST_COMPLETED意味著有一個完成了就可以了, FIRST_EXCEPTION是第一個出現異常就會停止wait
例如:
from concurrent.futures import ThreadPoolExecutor,wait
import requests,time
url_list = ['https://www.cnblogs.com/', 'https://www.csdn.net/', 'https://github.com/']
def get_url(url):
content = requests.get(url).content.decode()
print(url+'已獲取')
return url
def error(url):
gg
pool = ThreadPoolExecutor(max_workers=4)
future_list = []
start = time.time()
future_list.append(pool.submit(error,'https://www.cnblogs.com/'))
for url in url_list:
future = pool.submit(get_url,url)
future_list.append(future)
print(wait(future_list,return_when='FIRST_EXCEPTION'))
end = time.time()
print(end-start)
DoneAndNotDoneFutures(done={Future at 0x7fd1a5b95320 state=finished raised NameError}, not_done={Future at 0x7fd1a4b11a90 state=running, Future at 0x7fd1a4b11a20 state=running, Future at 0x7fd1a4c897f0 state=running})
0.001996755599975586
https://www.cnblogs.com/已獲取
https://www.csdn.net/已獲取
https://github.com/已獲取
ProcessPoolExecutor
進程池與線程池的使用方式基本相同,套用即可
-
什麼是進程 進程是一個可執行的應用程式,任何進程都有一個主線程作為入口,是線程的集合 什麼是多線程 多線程可以提高效率,我們在電腦操作的時候,開多個視窗,並不是多線程併發,是cpu在切換,只不過速度很快,我們感覺不到,多線程是在同一個時刻同時進行 為什麼要使用多線程? 假設你有100桶水,你一個小時 ...
-
一、實驗目的 熟悉c語言集成開發環境 掌握c程式結構,熟悉c程式編碼規範 掌握c程式編寫、編譯、運行、調試方法 掌握基本數據類型、常量、變數的使用 掌握常用運算符用法,掌握表達式求值規則 二、實驗準備 實驗前,請圍繞以下內容複習教材第1章、第2章相關內容: 1. 一個完整的c程式結構和書寫規範(教材 ...
-
1.引入依賴 org.springframework.boot spring boot starter parent 1.5.3.RELEASE <! lookup parent from repository org.springframework.boot spring boot starter ...
-
版權聲明: https://blog.csdn.net/qq_32595075/article/details/80059834一般面試中java Exception(runtimeException )是必會被問到的問題常見的異常列出四五種,是基本要求。更多的。。。。需要註意積累了 常見的幾種如下 ...
-
一 什麼是元類 一切源自於一句話:python中一切皆為對象。讓我們先定義一個類,然後逐步分析 所有的對象都是實例化或者說調用類而得到的(調用類的過程稱為類的實例化),比如對象t1是調用類OldboyTeacher得到的。 如果一切皆為對象,那麼類OldboyTeacher本質也是一個對象,既然所有 ...
-
1.Python基礎學習之高級數組(一) 1.1視圖:就是與較大數組共用相同數據的較小數組。Numpy包提供數據視圖的概念是為了精確地控制記憶體的使用方式。 數組視圖、切片視圖、轉置和重塑視圖等 數組視圖實例: from numpy import* M=array([[1.,2.],[3.,4.]]) ...
-
windows下 1.安裝golang 2.安裝git(主要是go get 引用git上的包) 3. 使用預設安裝生成的目錄 pkg:包含包對象,編譯好的庫文件 src:包含 Go 源文件,註意:你自己創建依賴的package,也要放到GOPATH 目錄下,這樣才能夠被引用到。 bin:包含可執行命 ...
-
認證Authentication 什麼是身份認證 身份驗證是將傳入請求與一組標識憑據(例如請求來自的用戶或與其簽名的令牌)關聯的機制。 視圖的最開始處運行身份驗證 在許可權和限制檢查發生之前,以及在允許繼續執行任何其他代碼之前,始終在視圖的最開始處運行身份驗證。 身份驗證方案總是定義為類的列表 RES ...