在眾多編程語言中,Python的社區生態是其中的佼佼者之一。幾乎所有的技術痛點,例如優化代碼提升速度,在社區內都有很多成功的解決方案。本文分享的就是一份可以令 Python 變快的工具清單,值得瞭解下。 一、序言 這篇文章會提供一些優化代碼的工具。會讓代碼變得更簡潔,或者更迅速。 當然這些並不能代替 ...
在眾多編程語言中,Python的社區生態是其中的佼佼者之一。幾乎所有的技術痛點,例如優化代碼提升速度,在社區內都有很多成功的解決方案。本文分享的就是一份可以令 Python 變快的工具清單,值得瞭解下。
一、序言
這篇文章會提供一些優化代碼的工具。會讓代碼變得更簡潔,或者更迅速。
當然這些並不能代替演算法設計,但是還是能讓Python加速很多倍。
其實前面講演算法的文章,也有提到過。比如適用於雙向隊列的 deque,以及在合適的條件下運用 bisect 和 heapq 來提升演算法的性能。
而且前面也提到過,Python提供了當今最高級也是最有效的排序演算法(list.sort)。
另外還有一個功能多樣又迅速的散列表(dict)。而且如果寫迭代器封裝、功能性代碼或者是某種額外擴展的時候,或許 CyToolz可以用得到。當然在itertools和 functools模塊 中,還有很多函數可以帶來很高效的代碼。
這篇文章主要講優化單處理器的代碼,下麵會介紹一些一些高效的函數實現,也有已經封裝好的拓展模塊,還包括速度更快的Python解釋器。
當然多處理器版本確實能大幅提高運行效率。如果想瞭解多核編程,可以從multiprocessing模塊開始。而且也能找到非常多的關於分散式計算的第三方工具。這裡可以看一下Python wiki上的關於Parallel Processing的內容。
接下來,會說一些關於Python加速工具的選單。
二、正文
1、NumPy、SciPy、Sage和Pandas
先說,NumPy。它的核心是一個多維數字數組的實現。除了這個數據結構之外,還實現了若幹個函數和運算符,可以高效地進行數組運算。並且對於被調用的次數進行了精簡。它可以被用來進行極其高效的數學運算。
SciPy和Sage都將NumPy內置為自身的一部分,同時內置了其他的不同的工具,從而可以用於特定科學、數學和高性能計算的模塊。
Pandas是一個側重於數據分析的工具。如果處理大量半結構化數據的時候,可能也會用到Pandas相關的工具,比如Blaze。
2、PyPy、Pyston、Parakeet、Psyco和Unladen Swallow
讓代碼運行的更快,侵入性最小的就是使用實時編譯器(JIT編譯)。以前的話我們可以直接安裝Psyco。安裝之後導入psyco,然後調用psyco.full()。代碼運行速度就可以明顯提升。運行Python代碼的時候,它可以實時監控程式,會將一部分代碼編譯為了機器碼。
現在好多Psyco等加速器的項目已經停止維護了,不過類似的功能在PyPy中得到了繼承。
PyPy為了方便分析、優化和翻譯,用Python語言將Python重新實現了一遍,這樣就可以JIT編譯。而且PyPy可以直接將代碼翻譯成像C那樣的性能更高的語言。
Unladen Swallow是一個Python的JIT編譯器。是Python解釋器的一本版本,被稱為底層虛擬機(LLVM)。不過這個開發已經停止了。
Pyston是一個與LLVM平臺較為接近的Python的JIT編譯器。很多時候已經優於Python的實現,但不過還有很多地方不完善。
3、GPULib、PyStream、PyCUDA和PyOpenCL
這四個都是用在圖像處理單元來實現代碼的加速。前面講的都是用代碼優化來實現加速的。而這些都是從硬體層面上進行加速,如果有一個強大的GPU,我們可以用GPU來計算,從而減少CPU寶貴的資源。
PyStream古老一點。GPULib提供了基於GPU的各種形式的數據計算。
如果用GPU加速自己的代碼,可以用PyCUDA和PyOpenCL。
4、Pyrex、Cython、Numba和Shedskin
這四個項目都致力於將Python代碼翻譯為C、C++和LLVM的代碼。Shedskin會將代碼編譯為C++語言。Pyrex、Cython編譯的主要目標是C語言。Cython也是Pyrex的一個分支。
而且,Cython還有NumPy數組的額外支持。
如果面向數組和數學計算的時候,Numba是更好的選擇導入時會自動生成相應的LLVM的代碼。升級版本是NumbaPro,還提供了對GPU的支持。
5、SWIG、F2PY和Boost.Python
這些工具可以將其他的語言封裝為Python的模塊。第一個可以封裝C/C++語言。F2PY可以封裝Fortran。Boost.Python可以封裝C++語言。
SUIG只要啟動一個命令行工具,往裡面輸入C或者C++的頭文件,封裝器代碼就會自動生成。除了Python,而且可以成為其他語言的封裝器,比如Java和PHP。
6、ctypes、llvm-py和CorePy2
這些模塊可以幫助我們實現Python底層對象的操作。ctypes模塊可以用於在記憶體中構建編譯C的對象。並且調用共用庫中的C的函數。不過ctypes已經包含在Python的標準庫裡面了。
llvm-py主要提供LLVM的Python介面。以便於構建代碼,然後編譯他們。也可以在Python中構建它的編譯器。當然搞出自己編程語言也是可以的。
CorePy2也可以進行加速,不過這個加速是運行在彙編層的。
7、Weave、Cinpy和PyInline
這三個包,就可以讓我們在Python代碼中直接使用C語言或者其他的高級語言。混合代碼,依然可以保持整潔。可以使用Python代碼的字元串的多行特性,可以使其他的代碼按照自身的風格來進行排版。
8、其他工具
如果我們要節省記憶體,就不能使用JIT了。一般JIT都太耗費記憶體。有一句話說的很對,時間和記憶體經常不能兼得,而我們在工程開發中,總是要尋找他們的平衡點。
至於其他的一些東西,比如Micro Python項目,這個是用在嵌入式設備或者微控制器上面使用的。
兄弟們,今天的分享就到這裡了,債見!
文章不過癮?試試看視頻吧! Python爬蟲入門到實戰全集100集教程:代碼總是學完就忘記?100個爬蟲實戰項目!讓你沉迷學習丨學以致用丨下一個Python大神就是你! Python tkinter 合集:全網最全python tkinter教程!包含所有知識點!輕鬆做出好看的tk程式!