也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始: 猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎? 這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧! 本文索引 LEGB原則 名字隱藏和暫時性死區 ...
也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始:
i = 0
def f():
print(i)
i += 1
print(i)
f()
print(i)
猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎?
> python test.py
Traceback (most recent call last):
File "a.py", line 7, in <module>
f()
File "a.py", line 3, in f
print(i)
UnboundLocalError: local variable 'i' referenced before assignment
這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧!
本文索引
LEGB原則
變數的作用域,這是一個老生常談的問題了。
在python中作用域規則可以簡單的歸納為LEGB原則
,也就是說,對於一個變數name
,首先會從當前的作用域開始查找,如果它不在函數里那就從global開始,沒找到就查找builtin作用域,如果它位於函數中,就先從local作用域查找,接著如果當前的函數是一個閉包,那麼就查找外層閉包的作用域,也就是規則中的E
,接著是global和builtin,如果都沒找到name
這個變數,則拋出NameError
。
那麼我們來看一段代碼:
i = 100
def f():
print(i)
在這段代碼中,print位於builtin作用域,i位於global,那麼:
- 在函數f中找不到這兩個名字,所以從local向上查找,
- 首先f不是閉包,因此跳過閉包作用域的查找,
- 然後查找global,找到了i,但print還未找到,
- 然後查找builtin,找到了print的builtin模塊里的一個函數。
至此名字查找結束,調用找到的函數,輸出結果100。
現在你可能更加疑惑了,既然查找規則按照LEGB
的方向進行,那麼test.py中的f不就應該找到i為global中的變數嗎,為什麼會報錯呢?
名字隱藏和暫時性死區
在揭曉答案之前,我們先複習一下名字隱藏。
它是指一個聲明在局部作用中的名字會隱藏外層作用域中的同名的對象。許多語言都遵守這一特性,python也不例外。
那麼暫時性死區是什麼呢?這是es6的一個概念,當你在局部作用域中定義了一個非全局的名字時,這個名字會綁定在當前作用域中,並將外部作用域的同名對象隱藏:
var i = 'hello'
function f() {
i = 'world'
let i
}
這段代碼中函數中的i被綁定在局部作用域(也就是函數體內)中,在綁定的作用域中可見,並將外部的名字隱藏,而對一個未聲明的局部變數賦值會導致錯誤,所以上面的代碼會引發ReferenceError: i is not defined
。
對於python來說也是一樣的問題,python代碼在執行前首先會被編譯成位元組碼,這就會導致某些時候實際執行的程式會和我們看到的產生出入。不過我們有dis
模塊幫忙,它可以輸出python對象的位元組碼,下麵我們就來看下經過編譯後的f
:
> dis(f)
2 0 LOAD_GLOBAL 0 (print)
2 LOAD_FAST 0 (i)
4 CALL_FUNCTION 1
6 POP_TOP
3 8 LOAD_CONST 1 ('a')
10 STORE_FAST 0 (i)
4 12 LOAD_GLOBAL 0 (print)
14 LOAD_FAST 0 (i)
16 CALL_FUNCTION 1
18 POP_TOP
20 LOAD_CONST 0 (None)
22 RETURN_VALUE
位元組碼的解釋在這裡。
其中LOAD_FAST
和STORE_FAST
是讀取和存儲local作用域的變數,我們可以看到,i變成了局部作用域的變數!而對i的賦值早於i的定義,所以報錯了。
產生這種現象的原因也很簡單,python對函數的代碼是獨立編譯的,如果未加說明而在函數內對一個變數賦值,那麼就認為你定義了一個局部變數,從而把外部的同名對象屏蔽了。這麼做無可厚非,畢竟python沒有獨立的聲明一個局部變數的語法,但結果就會造成我們看到的類似暫時性死區的現象。所以請允許我把es6的概念套用在python身上。
消除暫時性死區
既然知道問題的癥結在於python無法區分局部變數的聲明和定義,那麼我們就來解決它。
對於一個可以區分聲明和定義的語言來說是沒有這種煩惱的,比如c:
int i = 0;
void f(void)
{
i++;
printf("%d\n", i); // 1
const char *i = "hello";
printf("%s\n", i); // "hello"
}
python中不能這麼做,但是我們可以換一個思路,聲明一個變數是全局作用域的,這樣不就解決了嗎?
global
運算符就是為了這個目的而存在的,它聲明一個變數始終是全局作用域的變數,因此只要存在global聲明,那麼當前作用域里的這個名字就是一個對同名全局變數的引用。改進後的函數如下:
def f():
global i
print(i)
i += 1
print(i)
現在運行程式就會是你想要的結果了:
> python test.py
0
1
1
如果你還是不放心,那麼我們再來看看位元組碼:
> dis(f)
3 0 LOAD_GLOBAL 0 (print)
2 LOAD_GLOBAL 1 (i)
4 CALL_FUNCTION 1
6 POP_TOP
4 8 LOAD_CONST 1 ('a')
10 STORE_GLOBAL 1 (i)
5 12 LOAD_GLOBAL 0 (print)
14 LOAD_GLOBAL 1 (i)
16 CALL_FUNCTION 1
18 POP_TOP
20 LOAD_CONST 0 (None)
22 RETURN_VALUE
對於i的存取已經由LOAD_GLOBAL
和STORE_GLOBAL
接手了,沒問題。
當然global
也有它的局限性:
- 一旦聲明global,那麼這個名字始終是global作用域的一個變數,不可以再是局部變數
- 名字必須存在於global里,因為python在運行時進行名字查找,所以你的變數在global里找不到的話對它的引用將會出錯
- 接上一條,因為global限定了名字查找的範圍,所以像閉包作用域的變數就找不到了
事實上需要引用非global名字的需求是極其常見的,因此為瞭解決global的不足,python3引入了nonlocal
使用nonlocal聲明閉包作用域變數
假設我們有一個需求,一個函數需要知道自己被調用了多少次,最簡單的實現就是使用閉包:
def closure():
count = 0
def func():
# other code
count += 1
print(f'I have be called {count} times')
return func
還是老問題,這樣寫對嗎?
答案是不對,你又製造暫時性死區啦!
>>> f=closure()
>>> f()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 5, in func
UnboundLocalError: local variable 'count' referenced before assignment
這時候就要nonlocal
出場了,它聲明一個名字位於閉包作用域中,如果閉包作用域中未找到就報錯。
所以修正後的函數如下:
def closure():
count = 0
def func():
# other code
nonlocal count
count += 1
print(f'I have be called {count} times')
return func
測試一下:
>>> f=closure()
>>> f()
I have be called 1 times
>>> f()
I have be called 2 times
>>> f()
I have be called 3 times
>>> f2=closure()
>>> f2()
I have be called 1 times
現在可以正常使用和修改閉包作用域的變數了。
總結
當然,在函數里修改外部變數往往會導致潛在的缺陷,但有時這樣做又是對的,所以希望你在好好瞭解作用域規則的前提下合理地利用它們。
作用域規則可以總結為下:
- 名字查找按照LEGB規則進行,如果當前代碼在global中則從global作用域開始查找,否則從local開始
- builtin作用域中是內置類型和函數,所以它們總是能被找到,前提是不要在局部作用域中對它們賦值
- global中存放著所有定義在當前模塊和導入的名字
- local是局部作用域,存放在形成局部作用於的代碼中有賦值行為的名字
- 閉包作用域是閉包函數的外層作用域,裡面可以存放一些自定義的狀態
- global聲明一個名字在global作用域中
- nonlocal聲明一個名字在閉包作用域中
- 最重要的一條,當你在能產生局部作用域的代碼中對一個名字進行賦值,那麼這個名字就會被認為是一個local作用域的變數從而屏蔽其他作用域中的同名對象
只要記住這些規則你就可以和因作用域引起的各種問題說再見了。而且理解了這些規則還會為你探索更深層次的python打下堅實的基礎,所以請將它牢記於心。