python3的變數作用域規則和nonlocal關鍵字

来源:https://www.cnblogs.com/apocelipes/archive/2019/02/20/10408836.html
-Advertisement-
Play Games

也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始: 猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎? 這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧! 本文索引 LEGB原則 名字隱藏和暫時性死區 ...


也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始:

i = 0
def f():
  print(i)
  i += 1
  print(i)

f()
print(i)

猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎?

> python test.py
Traceback (most recent call last):
  File "a.py", line 7, in <module>
    f()
  File "a.py", line 3, in f
    print(i)
UnboundLocalError: local variable 'i' referenced before assignment

這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧!

本文索引

LEGB原則

變數的作用域,這是一個老生常談的問題了。

在python中作用域規則可以簡單的歸納為LEGB原則,也就是說,對於一個變數name,首先會從當前的作用域開始查找,如果它不在函數里那就從global開始,沒找到就查找builtin作用域,如果它位於函數中,就先從local作用域查找,接著如果當前的函數是一個閉包,那麼就查找外層閉包的作用域,也就是規則中的E,接著是global和builtin,如果都沒找到name這個變數,則拋出NameError

那麼我們來看一段代碼:

i = 100
def f():
  print(i)

在這段代碼中,print位於builtin作用域,i位於global,那麼:

  1. 在函數f中找不到這兩個名字,所以從local向上查找,
  2. 首先f不是閉包,因此跳過閉包作用域的查找,
  3. 然後查找global,找到了i,但print還未找到,
  4. 然後查找builtin,找到了print的builtin模塊里的一個函數。

至此名字查找結束,調用找到的函數,輸出結果100。

現在你可能更加疑惑了,既然查找規則按照LEGB的方向進行,那麼test.py中的f不就應該找到i為global中的變數嗎,為什麼會報錯呢?

名字隱藏和暫時性死區

在揭曉答案之前,我們先複習一下名字隱藏。

它是指一個聲明在局部作用中的名字會隱藏外層作用域中的同名的對象。許多語言都遵守這一特性,python也不例外。

那麼暫時性死區是什麼呢?這是es6的一個概念,當你在局部作用域中定義了一個非全局的名字時,這個名字會綁定在當前作用域中,並將外部作用域的同名對象隱藏:

var i = 'hello'
function f() {
  i = 'world'
  let i
}

這段代碼中函數中的i被綁定在局部作用域(也就是函數體內)中,在綁定的作用域中可見,並將外部的名字隱藏,而對一個未聲明的局部變數賦值會導致錯誤,所以上面的代碼會引發ReferenceError: i is not defined

對於python來說也是一樣的問題,python代碼在執行前首先會被編譯成位元組碼,這就會導致某些時候實際執行的程式會和我們看到的產生出入。不過我們有dis模塊幫忙,它可以輸出python對象的位元組碼,下麵我們就來看下經過編譯後的f

> dis(f)

2           0 LOAD_GLOBAL              0 (print)
            2 LOAD_FAST                0 (i)
            4 CALL_FUNCTION            1
            6 POP_TOP

3           8 LOAD_CONST               1 ('a')
           10 STORE_FAST               0 (i)

4          12 LOAD_GLOBAL              0 (print)
           14 LOAD_FAST                0 (i)
           16 CALL_FUNCTION            1
           18 POP_TOP
           20 LOAD_CONST               0 (None)
           22 RETURN_VALUE

位元組碼的解釋在這裡

其中LOAD_FASTSTORE_FAST是讀取和存儲local作用域的變數,我們可以看到,i變成了局部作用域的變數!而對i的賦值早於i的定義,所以報錯了。

產生這種現象的原因也很簡單,python對函數的代碼是獨立編譯的,如果未加說明而在函數內對一個變數賦值,那麼就認為你定義了一個局部變數,從而把外部的同名對象屏蔽了。這麼做無可厚非,畢竟python沒有獨立的聲明一個局部變數的語法,但結果就會造成我們看到的類似暫時性死區的現象。所以請允許我把es6的概念套用在python身上。

消除暫時性死區

既然知道問題的癥結在於python無法區分局部變數的聲明和定義,那麼我們就來解決它。

對於一個可以區分聲明和定義的語言來說是沒有這種煩惱的,比如c:

int i = 0;
void f(void)
{
  i++;
  printf("%d\n", i); // 1
  const char *i = "hello";
  printf("%s\n", i); // "hello"
}

python中不能這麼做,但是我們可以換一個思路,聲明一個變數是全局作用域的,這樣不就解決了嗎?

global運算符就是為了這個目的而存在的,它聲明一個變數始終是全局作用域的變數,因此只要存在global聲明,那麼當前作用域里的這個名字就是一個對同名全局變數的引用。改進後的函數如下:

def f():
  global i
  print(i)
  i += 1
  print(i)

現在運行程式就會是你想要的結果了:

> python test.py
0
1
1

如果你還是不放心,那麼我們再來看看位元組碼:

> dis(f)

3           0 LOAD_GLOBAL              0 (print)
            2 LOAD_GLOBAL              1 (i)
            4 CALL_FUNCTION            1
            6 POP_TOP

4           8 LOAD_CONST               1 ('a')
           10 STORE_GLOBAL             1 (i)

5          12 LOAD_GLOBAL              0 (print)
           14 LOAD_GLOBAL              1 (i)
           16 CALL_FUNCTION            1
           18 POP_TOP
           20 LOAD_CONST               0 (None)
           22 RETURN_VALUE

對於i的存取已經由LOAD_GLOBALSTORE_GLOBAL接手了,沒問題。

當然global也有它的局限性:

  • 一旦聲明global,那麼這個名字始終是global作用域的一個變數,不可以再是局部變數
  • 名字必須存在於global里,因為python在運行時進行名字查找,所以你的變數在global里找不到的話對它的引用將會出錯
  • 接上一條,因為global限定了名字查找的範圍,所以像閉包作用域的變數就找不到了

事實上需要引用非global名字的需求是極其常見的,因此為瞭解決global的不足,python3引入了nonlocal

使用nonlocal聲明閉包作用域變數

假設我們有一個需求,一個函數需要知道自己被調用了多少次,最簡單的實現就是使用閉包:

def closure():
  count = 0
  def func():
    # other code
    count += 1
    print(f'I have be called {count} times')

  return func

還是老問題,這樣寫對嗎?

答案是不對,你又製造暫時性死區啦!

>>> f=closure()
>>> f()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 5, in func
UnboundLocalError: local variable 'count' referenced before assignment

這時候就要nonlocal出場了,它聲明一個名字位於閉包作用域中,如果閉包作用域中未找到就報錯。

所以修正後的函數如下:

def closure():
  count = 0
  def func():
    # other code
    nonlocal count
    count += 1
    print(f'I have be called {count} times')

  return func

測試一下:

>>> f=closure()
>>> f()
I have be called 1 times
>>> f()
I have be called 2 times
>>> f()
I have be called 3 times
>>> f2=closure()
>>> f2()
I have be called 1 times

現在可以正常使用和修改閉包作用域的變數了。

總結

當然,在函數里修改外部變數往往會導致潛在的缺陷,但有時這樣做又是對的,所以希望你在好好瞭解作用域規則的前提下合理地利用它們。

作用域規則可以總結為下:

  1. 名字查找按照LEGB規則進行,如果當前代碼在global中則從global作用域開始查找,否則從local開始
  2. builtin作用域中是內置類型和函數,所以它們總是能被找到,前提是不要在局部作用域中對它們賦值
  3. global中存放著所有定義在當前模塊和導入的名字
  4. local是局部作用域,存放在形成局部作用於的代碼中有賦值行為的名字
  5. 閉包作用域是閉包函數的外層作用域,裡面可以存放一些自定義的狀態
  6. global聲明一個名字在global作用域中
  7. nonlocal聲明一個名字在閉包作用域中
  8. 最重要的一條,當你在能產生局部作用域的代碼中對一個名字進行賦值,那麼這個名字就會被認為是一個local作用域的變數從而屏蔽其他作用域中的同名對象

只要記住這些規則你就可以和因作用域引起的各種問題說再見了。而且理解了這些規則還會為你探索更深層次的python打下堅實的基礎,所以請將它牢記於心。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我一直都有一個疑問,豐巢業務服務的生產環境jvm參數設置是禁止system.gc的,也就是開啟設置:-XX:+DisableExplicitGC,但是生產環境卻從來沒有出現過堆外記憶體溢出的情況。說明一下,豐巢使用了阿裡開源的dubbo,而dubbo底層通信預設情況下使用了3.2.5.Final版本的 ...
  • 在實際開發過程中,我們有時候會遇到主線程調用子線程,要等待子線程返回的結果來進行下一步動作的業務。 那麼怎麼獲取子線程返回的值呢,我這裡總結了三種方式: Entity類 主線程等待(這個一看代碼便知曉,沒什麼問題) Join方法阻塞當前線程以等待子線程執行完畢 通過實現Callable介面 這裡又分 ...
  • 一、冒泡排序 冒泡排序(Bubble Sort)是一種交換排序,它的基本思想是:兩兩比較相鄰記錄的關鍵字,如果反序則交換,直到沒有反序的記錄為止。 進一步理解為(假設由小到大排序):對於給定的n個記錄,從第一個記錄開始依次對相鄰的兩個記錄進行比較,當前面的記錄大於後面的記錄時,交換位置,進行一輪比較 ...
  • BUG觸發時的完整報錯內容(本地無關路徑用已經用 隱去): 在解析HTML時,標簽開始部分使用形如 的瀏覽器判斷標識符,結束時結束標簽 (正確的開始和結束標簽應該為 和 )無法正常匹配關閉即可觸發。 觸發BUG的示例代碼如下: 在 Python 3.7.0 版本中,觸發BUG部分的代碼存在於 中的 ...
  • 題目1.7 1 列印沙漏 (20 分) 本題要求你寫個程式把給定的符號列印成沙漏的形狀。例如給定17個“ ”,要求按下列格式列印 所謂“沙漏形狀”,是指每行輸出奇數個符號;各行符號中心對齊;相鄰兩行符號數差2;符號數先從大到小順序遞減到1,再從小到大順序遞增;首尾符號數相等。 給定任意N個符號,不一 ...
  • 1. __new__ 和 __init__ 的區別 python 2.x 老式類(預設繼承type) 老式類中沒有__new__類方法(也就是說定義也不會執行,它不是老式類的類方法),__Init__ 作為構造函數,創建實例對象,並初始化。 過程: 類 => __init__() => 實例(sel ...
  • 題意 "題目鏈接" Sol 神仙題Orz 尾碼自動機 + 線段樹合併。。。 首先可以轉化一下模型(想不到qwq):問題可以轉化為統計$B$中每個首碼在$A$中出現的次數。(畫一畫就出來了) 然後直接對$A$串建SAM,線段樹合併維護一下siz就行了 cpp include using namespa ...
  • python多線程與多進程 多線程: 案例:掃描給定網路中存活的主機(通過ping來測試,有響應則說明主機存活) 普通版本: 運行效果如下: 在python裡面,線程的創建有兩種方式,其一使用Thread類創建導入Python標準庫中的Thread模塊 from threading import T ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...