聲明:本人的一切著作,禁止用於以營銷為目的的任何轉載! 前言 很久以前就聽說 Python 的 async/await 很厲害,但是直到現在都沒有用過,一直都在用多線程模型來解決各種問題。最近看到隔壁的 Go 又很火,所以決定花時間研究下 Python 協程相關的內容,終於在翻閱了一褲衩的資料之後有 ...
聲明:本人的一切著作,禁止用於以營銷為目的的任何轉載!
前言
很久以前就聽說 Python 的 async/await 很厲害,但是直到現在都沒有用過,一直都在用多線程模型來解決各種問題。最近看到隔壁的 Go 又很火,所以決定花時間研究下 Python 協程相關的內容,終於在翻閱了一褲衩的資料之後有了一些理解。
起:一切從生成器開始
以往在 Python 開發中,如果需要進行併發編程,通常是使用多線程 / 多進程模型實現的。由於 GIL 的存在,多線程對於計算密集型的任務並不十分友好,而對於 IO 密集型任務,可以在等待 IO 的時候進行線程調度,讓出 GIL,實現『假併發』。
當然對於 IO 密集型的任務另外一種選擇就是協程,協程其實是運行在單個線程中的,避免了多線程模型中的線程上下文切換,減少了很大的開銷。為了理解協程、async/await、asyncio,我們要從最古老的生成器開始。
回顧 Python 的歷史,生成器這個概念第一次被提出的時候是在PEP 255中被提出的,當時的 Python 版本為 Python2.2。我們都知道range()函數,現在考慮一下我們來編寫一個自己的range()函數,最直接最容易想到的方法也許是這樣:
當你想創建一個很小的序列的時候,例如創建從 0 到 100 這樣的列表,似乎沒什麼問題。但是如果想創建一個從 0 到 999999999 這麼大的列表的話,就必須要創建一個完整的,長度是 999999999 的列表,這個行為非常占用記憶體。於是就有了生成器,用生成器來改寫這個函數的話,會是下麵這個樣子:
當函數執行遇到yield的時候,會暫停執行。這樣只需在記憶體中維護可以存儲一個整數的記憶體空間就可以了。
承:協程誕生
到這裡可能還和協程沒什麼關係,但是實際上這已經是 Python 協程的雛形了,我們來看看維基上對於協程的定義:
Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing
multiple entry points for suspending and resuming execution at certain locations.
從某些角度來理解,協程其實就是一個可以暫停執行的函數,並且可以恢復繼續執行。那麼yield已經可以暫停執行了,如果在暫停後有辦法把一些 value 發回到暫停執行的函數中,那麼 Python 就有了『協程』。於是在PEP 342中,添加了 “把東西發回已經暫停的生成器中” 的方法,這個方法就是send(),並且在 Python2.5 中得到了實現。利用這個特性我們繼續改寫
range()函數:
就這樣,整個生成器的部分似乎已經進入了stable的狀態,但是在 Python3.3 中,這個情況發生了改變。在PEP 380中,為 Python3.3 添加了yield from,這個東西可以讓你從迭代器中返回任何值(這裡用的是迭代器,因為生成器也是一種迭代器),也可以讓你重構生成器,我們來看這個例子:
這個特性也可以讓生成器進行串聯,使數據在多個生成器中進行傳遞。歷史發展到這裡,協程的出現似乎已經就差一步了,或者這裡說是非同步編程更恰當。在 Python3.4 中加入了 asyncio 庫,使 Python 獲得了事件迴圈的特性(關於事件迴圈的內容這裡不再贅述)。asyncio + 生成器已經達到了非同步編程的條件,在 Python3.4 中,我們就可以這樣實現一個非同步的模型:
這裡的asyncio.coroutine裝飾器是用來標記這個函數是一個協程的,因為asyncio要求所有要用作協程的生成器必須由asyncio.coroutine裝飾。在這段代碼中,時間迴圈會啟動兩個countdown()協程,他們會一直執行,直到遇到了yield from asyncio.sleep(),會暫停執行,並且將一個asyncio.Future對象返回給事件迴圈。事件迴圈會監控這個asyncio.Future對象,一旦其執行完成後,將會把這個 Future 的執行結果返回給剛剛因為這個 Future 暫停的協程,並且繼續執行原協程。
從這個具體的例子出發,抽象點來看,實際上這個過程變成了:
-
你可以對任何asyncio.Future的對象進行yield from,將這個 Future 對象交給事件迴圈;
-
暫停執行的協程將等待這個 Future 的完成;
-
一旦 Future 獲取到事件迴圈,並執行完所有的代碼;
-
事件迴圈感知到 Future 執行完畢,原暫停的協程會通過 send() 方法獲取 Future 對象的返回值並且繼續執行;
轉:從 yield from 到 await
終於到了最激動人心的地方,在 Python3.5 中,添加了types.coroutine裝飾器以及async def和await。我們先來看一下 Python3.4 和 Python3.5 中如何定義一個協程函數:
看起來 Python3.5 中定義協程更為簡單了,但是實際上生成器和協程之間的差別變的更加明顯了。這裡先要指出兩個個註意點:
-
await 只能用於 async def 的函數中;
-
yield from 不能用於 async def 的函數中;
除此之外,yield from和await可以接受的對象是略有區別的,await接受的對象必須是一個awaitable對象。什麼是awaitable對象呢,就是一個實現了__await()__方法的對象,而且這個方法必須返回一個不是協程的迭代器。滿足這兩個條件,才算是一個awaitable對象,當然協程本身也是awaitable對象,因為collections.abc.Coroutine繼承了collections.abc.Awaitable。換句話說,await後面可接受的對象有兩種,分別是:協程和awaitable對象,當然協程也是awaitable對象。
在 Python3.6 中,這種特性繼續被髮揚光大,現在可以在同一個函數體內使用yield和await,而且除此之外,也可以在列表推導等地方使用async for或await語法。
尾聲
到這裡整個協程的歷史已經是回顧完了,對於 Python 中的協程也有了一些理解!