Python全局解釋器鎖

来源:http://www.cnblogs.com/gengcx/archive/2017/09/10/7500401.html
-Advertisement-
Play Games

超過十年以上,沒有比解釋器全局鎖(GIL)讓Python新手和專家更有挫折感或者更有好奇心。 Python的底層 要理解GIL的含義,我們需要從Python的基礎講起。像C++這樣的語言是編譯型語言,所謂編譯型語言,是指程式輸入到編譯器,編譯器再根據語言的語法進行解析,然後翻譯成語言獨立的中間表示, ...


  超過十年以上,沒有比解釋器全局鎖(GIL)讓Python新手和專家更有挫折感或者更有好奇心。

   Python的底層

    要理解GIL的含義,我們需要從Python的基礎講起。像C++這樣的語言是編譯型語言,所謂編譯型語言,是指程式輸入到編譯器,編譯器再根據語言的語法進行解析,然後翻譯成語言獨立的中間表示,最終鏈接成具有高度優化的機器碼的可執行程式。編譯器之所以可以深層次的對代碼進行優化,是因為它可以看到整個程式(或者一大塊獨立的部分)。這使得它可以對不同的語言指令之間的交互進行推理,從而給出更有效的優化手段。   

    與此相反,Python是解釋型語言。程式被輸入到解釋器來運行。解釋器在程式執行之前對其並不瞭解;它所知道的只是Python的規則,以及在執行過程中怎樣去動態的應用這些規則。它也有一些優化,但是這基本上只是另一個級別的優化。由於解釋器沒法很好的對程式進行推導,Python的大部分優化其實是解釋器自身的優化。更快的解釋器自然意味著程式的運行也能“免費”的更快。也就是說,解釋器優化後,Python程式不用做修改就可以享受優化後的好處。

    這一點很重要,讓我們再強調一下。如果其他條件不變,Python程式的執行速度直接與解釋器的“速度”相關。不管你怎樣優化自己的程式,你的程式的執行速度還是依賴於解釋器執行你的程式的效率。這就很明顯的解釋了為什麼我們需要對優化Python解釋器做這麼多的工作了。對於Python程式員來說,這恐怕是與免費午餐最接近的了。

    免費午餐結束了

    還是沒有結束?摩爾定律給出了硬體速度會按照確定的時間周期增長,與此同時,整整一代程式員學會瞭如何編碼。如果一個人寫了比較慢的代碼,最簡單的結果通常是更快的處理器去等待代碼的執行。顯然,摩爾定律仍然是正確的,並且還會在很長一段時間生效,不過它提及的方式有了根本的變化。並非是時鐘頻率增長到一個高不可攀的速度,而是通過多核來利用晶體管密度提高帶來的好處。在新處理器上運行的程式要想充分利用其性能,必須按照併發方式進行重寫。

    大部分開發者聽到“併發”通常會立刻想到多線程的程式。目前來說,多線程執行還是利用多核系統最常用的方式。儘管多線程編程大大好於“順序”編程,不過即便是仔細的程式員也沒法在代碼中將併發性做到最好。編程語言在這方面應該做的更好,大部分應用廣泛的現代編程語言都會支持多線程編程

    意外的事實

    現在我們來看一下問題的癥結所在。要想利用多核系統,Python必須支持多線程運行。作為解釋型語言Python的解釋器必須做到既安全又高效。我們都知道多線程編程會遇到的問題。解釋器要留意的是避免在不同的線程操作內部共用的數據。同時它還要保證在管理用戶線程時保證總是有最大化的計算資源。

    那麼,不同線程同時訪問時,數據的保護機制是怎樣的呢?答案是解釋器全局鎖。從名字上看能告訴我們很多東西,很顯然,這是一個加在解釋器上的全局(從解釋器的角度看)鎖(從互斥或者類似角度看)。這種方式當然很安全,但是它有一層隱含的意思(Python初學者需要瞭解這個):對於任何Python程式,不管有多少的處理器,任何時候都總是只有一個線程在執行

    許多人都是偶然發現這個事實的。網上的很多討論組和留言板都充斥著來自Python初學者和專家的類似這樣的問題——”為什麼我全新的多線程Python程式運行得比其只有一個線程的時候還要慢?“許多人在問這個問題時還是非常犯暈的,因為顯然一個具有兩個線程的程式要比其只有一個線程時要快(假設該程式確實是可並行的)。事實上,這個問題被問得如此頻繁以至於Python的專家們精心製作了一個標準答案:”不要使用多線程,請使用多進程。“但這個答案比那個問題更加讓人困惑。難道我不能在Python中使用多線程?在Python這樣流行的一個語言中使用多線程究竟是有多糟糕,連專家都建議不要使用。難道我真的漏掉了一些東西?

    很遺憾,沒有任何東西被漏掉。由於Python解釋器的設計,使用多線程以提高性能應該算是一個困難的任務。在最壞的情況下,它將會降低(有時很明顯)你的程式的運行速度。一個電腦科學與技術專業的大學生新手可能會告訴你當多個線程都在競爭一個共用資源時將會發生什麼。結果通常不會非常理想。很多情況下多線程都能很好地工作,可能對於解釋器的實現和內核開發人員來說,沒有關於Python多線程性能的過多抱怨

    現在該怎麼辦?驚慌?

    那麼,這又能怎樣?問題解決了嗎?難道我們作為Python開發人員就意味著要放棄使用多線程來探索並行的想法了?為什麼無論怎樣,GIL需要保證只有一個線程在某一時刻處於運行中?難道不可以添加細粒度的鎖來阻止多個獨立對象的同時訪問?並且為什麼之前沒有人去嘗試過類似的事情?

    這些實用的問題有著十分有趣的回答。GIL對諸如當前線程狀態和為垃圾回收而用的堆分配對象這樣的東西的訪問提供著保護。然而,這對Python語言來說沒什麼特殊的,它需要使用一個GIL。這是該實現的一種典型產物。現在也有其它的Python解釋器(和編譯器)並不使用GIL。雖然,對於CPython來說,自其出現以來已經有很多不使用GIL的解釋器

    那麼為什麼不拋棄GIL呢?許多人也許不知道,在1999年,針對Python 1.5,一個經常被提到但卻不怎麼理解的“free threading”補丁已經嘗試實現了這個想法,該補丁來自Greg Stein。在這個補丁中,GIL被完全的移除,且用細粒度的鎖來代替。然而,GIL的移除給單線程程式的執行速度帶來了一定的代價。當用單線程執行時,速度大約降低了40%。使用兩個線程展示出了在速度上的提高,但除了這個提高,這個收益並沒有隨著核數的增加而線性增長。由於執行速度的降低,這一補丁被拒絕了,並且幾乎被人遺忘。

    移除GIL非常困難,讓我們去購物吧!

    譯者註:XXX is hard. Let's go shopping!在英語中類似於中文的咆哮體。其隱含意思為想成功完成某件事情非常困難,我們去直接尋找第三方的產品替代吧。)

    不過,“free threading”這個補丁是有啟發性意義的,其證明瞭一個關於Python解釋器的基本要點:移除GIL是非常困難的。由於該補丁發佈時所處的年代,解釋器變得依賴更多的全局狀態,這使得想要移除當今的GIL變得更加困難。值得一提的是,也正是因為這個原因,許多人對於嘗試移除GIL變得更加有興趣。困難的問題往往很有趣。

    但是這可能有點被誤導了。讓我們考慮一下:如果我們有了一個神奇的補丁,其移除了GIL,並且沒有對單線程的Python代碼產生性能上的下降,那麼什麼事情將會發生?我們將會獲得我們一直想要的:一個線程API可能會同時利用所有的處理器。那麼現在,我們已經獲得了我們希望的,但這確實是一個好事嗎?

    基於線程的編程毫無疑問是困難的。每當某個人覺得他瞭解關於線程是如何工作的一切的時候,總是會悄無聲息的出現一些新的問題。因為在這方面想要得到正確合理的一致性真的是太難了,因此有一些非常知名的語言設計者和研究者已經總結得出了一些線程模型。就像某個寫過多線程應用的人可以告訴你的一樣,不管是多線程應用的開發還是調試都會比單線程的應用難上數倍。程式員通常所具有的順序執行的思維模恰恰就是與並行執行模式不相匹配。GIL的出現無意中幫助了開發者免於陷入困境。在使用多線程時仍然需要同步原語的情況下,GIL事實上幫助我們保持不同線程之間數據一致性問題

    那麼現在看起來討論Python最難得問題是有點問錯了問題。我們有非常好的理由來說明為什麼Python專家推薦我們使用多進程代替多線程,而不是去試圖隱藏Python線程實現的不足。更進一步,我們鼓勵開發者使用更安全更直接的方式實現併發模型,同時保留使用多線程進行開發除非你覺的真的非常必要的話。對於大多數人來說什麼是最好的並行編程模型可能並不是十分清楚。但是目前我們清楚的是多線程的方式可能並不是最好的

    至於GIL,不要認為它在那的存在就是靜態的和未經分析過的。Antoine Pitrou 在Python 3.2中實現了一個新的GIL,並且帶著一些積極的結果。這是自1992年以來,GIL的一次最主要改變。這個改變非常巨大,很難在這裡解釋清楚,但是從一個更高層次的角度來說,舊的GIL通過對Python指令進行計數來確定何時放棄GIL。這樣做的結果就是,單條Python指令將會包含大量的工作,即它們並沒有被1:1的翻譯成機器指令。在新的GIL實現中,用一個固定的超時時間來指示當前的線程以放棄這個鎖。在當前線程保持這個鎖,且當第二個線程請求這個鎖的時候,當前線程就會在5ms後被強制釋放掉這個鎖(這就是說,當前線程每5ms就要檢查其是否需要釋放這個鎖)。當任務是可行的時候,這會使得線程間的切換更加可預測。

    然而,這並不是一個完美的改變。對於在各種類型的任務上有效利用GIL這個領域里,最活躍的研究者可能就是David Beazley了。除了對Python 3.2之前的GIL研究最深入,他還研究了這個最新的GIL實現,並且發現了很多有趣的程式方案。對於這些程式,即使是新的GIL實現,其表現也相當糟糕。他目前仍然通過一些實際的研究和發佈一些實驗結果來引領並推進著有關GIL的討論。

    不管某一個人對Python的GIL感覺如何,它仍然是Python語言里最困難的技術挑戰。想要理解它的實現需要對操作系統設計、多線程編程、C語言、解釋器設計和CPython解釋器的實現有著非常徹底的理解。單是這些所需準備的就妨礙了很多開發者去更徹底的研究GIL。雖然如此,並沒有跡象表明GIL在不久以後的任何一段時間內會遠離我們。目前,它將繼續給那些新接觸Python,並且與此同時又對解決非常困難的技術問題感興趣的人帶來困惑和驚喜。

    以上內容是基於我目前對Python解釋器所做出的研究而寫。雖然我還希望寫一些有關解釋器的其它方面內容,但是沒有任何一個比全局解釋器鎖(GIL)更為人所知。雖然我認為這裡有些內容是不准確的,但是這些技術上的細節與CPython的很多資源條目是不同的。如果你發現了不准確的內容,請及時告知我,這樣我就會儘快對其進行改正。(本文來自:http://www.oschina.net/translate/pythons-hardest-problem)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 開篇先來說一下寫這篇文章的初衷。 初到來畫,通讀了來畫 UWP App 的代碼,發現裡面確實有很多比較高深的技術點,同時也是有很多問題的,擴展性,耦合,性能,功能等等。於是我們決定從頭重構這個產品,做一個全新的 “來畫Pro” 出來,歷經三個月的世間,這個產品終於正式上架。 (做個小廣告,在 Win ...
  • 1 using System; 2 using System.Collections.Generic; 3 using System.Linq; 4 using System.Text; 5 using System.Threading.Tasks; 6 7 8 namespace Wrox.Pro... ...
  • 上個月在網上看到一個用web實現簡單AR效果的文章,然後自己一路折騰,最後折騰出來一個 Asp.net+WebSocket+Emgucv實時人臉識別的東西,網上也有不少相關資料,有用winform的也有asp.net的。其實人臉識別技術早就成熟了,就是沒機會接觸這方面。百度了一下 找到好多,Jque ...
  • 本文主要介紹下運用docker虛擬技術打包Asp.net core應用。 Docker作為一個開源的應用容器引擎,近幾年得到廣泛的應用,使用Docker我們可以輕鬆實現應用的持續集成部署,一次打包,到處運行。 ...
  • step one:(找入口) using System.Reflection; //引用需要用到的命名空間 做任何事都要有開始的地方,不例外,反射也要先找到反射的入口,舉個慄子: Assembly assemble = Assembly.Load("SqlServer"); //反射的入口::動態的 ...
  • WebForm.aspx 頁面通過 AJAX 訪問WebForm.aspx.cs類中的方法,獲取數據 WebForm1.aspx 頁面 (原生AJAX請求,寫法一) WebForm1.aspx 頁面 (AJAX請求,寫法二,一般情況下我們用這種) WebForm1.aspx.cs 如果你是try.. ...
  • APM非同步編程模式最具代表性的特點是:一個非同步功能由以Begin開頭、End開頭的兩個方法組成。Begin開頭的方法表示啟動非同步功能的執行,End開頭的方法表示等待非同步功能執行結束並返回執行結果。 ...
  • 1 Maven的簡介 是apache下的一個開源項目,是純java開發,並且只是用來管理java項目的 Svn eclipse maven量級 同一個項目,普通的傳統項目(24M)而Maven項目只需要(724KB) 分析:maven項目為什麼這麼小?沒有jar。 需要jar嗎?肯定需要。沒有存在於 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...