本文詳細講解Python的命名空間,作用域,以及在使用中的一些常見困惑。 ...
Python進階 - 命名空間與作用域
寫在前面
如非特別說明,下文均基於
Python3
命名空間與作用於跟名字的綁定相關性很大,可以結合另一篇介紹Python
名字、對象及其綁定的文章。
1. 命名空間
1.1 什麼是命名空間
Namespace
命名空間,也稱名字空間,是從名字到對象的映射。Python
中,大部分的命名空間都是由字典來實現的,但是本文的不會涉及命名空間的實現。
命名空間的一大作用是避免名字衝突:
def fun1():
i = 1
def fun2():
i = 2
同一個模塊中的兩個函數中,兩個同名名字i
之間絕沒有任何關係,因為它們分屬於不同明明空間。
1.2 命名空間的種類
常見的命名空間有:
built-in
名字集合,包括像abs()
這樣的函數,以及內置的異常名字等。通常,使用內置這個詞表示這個命名空間-內置命名空間模塊全局名字集合,直接定義在模塊中的名字,如類,函數,導入的其他模塊等。通常,使用全局命名空間表示。
函數調用過程中的名字集合,函數中的參數,函數體定義的名字等,在函數調用時被“激活”,構成了一個命名空間。通常,使用局部命名空間表示。
一個對象的屬性集合,也構成了一個命名空間。但通常使用
objname.attrname
的間接方式訪問屬性,而不是直接訪問,故不將其列入命名空間討論。類定義的命名空間,通常解釋器進入類定義時,即執行到
class ClassName:
語句,會新建一個命名空間。(見官方對類定義的說明)
1.3 命名空間的生命周期
不同類型的命名空間有不同的生命周期:
內置命名空間,在
Python
解釋器啟動時創建,解釋器退出時銷毀;全局命名空間,模塊的全局命名空間在模塊定義被解釋器讀入時創建,解釋器退出時銷毀;
局部命名空間,這裡要區分函數以及類定義。函數的局部命名空間,在函數調用時創建,函數返回或者由未捕獲的異常時銷毀;類定義的命名空間,在解釋器讀到類定義創建,類定義結束後銷毀。(關於類定義的命名空間,在類定義結束後銷毀,但其實類對象就是這個命名空間內容的包裝,見官方對類定義的說明)
2. 作用域
2.1 什麼是作用域
作用域是Python
的一塊文本區域,這個區域中,命名空間可以被“直接訪問”。這裡的直接訪問指的是試圖在命名空間中找到名字的絕對引用(非限定引用)。這裡有必要解釋下直接引用和間接引用:
直接引用;直接使用名字訪問的方式,如
name
,這種方式嘗試在名字空間中搜索名字name
。間接引用;使用形如
objname.attrname
的方式,即屬性引用,這種方式不會在命名空間中搜索名字attrname
,而是搜索名字objname
,再訪問其屬性。
2.2 與命名空間的關係
現在,命名空間持有了名字。作用域是Python
的一塊文本區域,即一塊代碼區域,需要代碼區域引用名字(訪問變數),那麼必然作用域與命名空間之間就有了聯繫。
顧名思義,名字作用域就是名字可以影響到的代碼文本區域,命名空間的作用域就是這個命名空間可以影響到的代碼文本區域。那麼也存在這樣一個代碼文本區域,多個命名空間可以影響到它。
作用域只是文本區域,其定義是靜態的;而名字空間卻是動態的,只有隨著解釋器的執行,命名空間才會產生。那麼,在靜態的作用域中訪問動態命名空間中的名字,造成了作用域使用的動態性。
那麼,可以這樣認為:
靜態的作用域,是一個或多個命名空間按照一定規則疊加影響代碼區域;運行時動態的作用域,是按照特定層次組合起來的命名空間。
在一定程度上,可以認為動態的作用域就是命名空間。在後面的表述中,我會把動態的作用域與其對應命名空間等同起來。
2.3 名字搜索規則
在程式中引用了一個名字,Python
是怎樣搜索到這個名字呢?
在程式運行時,至少存在三個命名空間可以被直接訪問的作用域:
Local
首先搜索,包含局部名字的最內層(innermost)作用域,如函數/方法/類的內部局部作用域;Enclosing
根據嵌套層次從內到外搜索,包含非局部(nonlocal)非全局(nonglobal)名字的任意封閉函數的作用域。如兩個嵌套的函數,內層函數的作用域是局部作用域,外層函數作用域就是內層函數的 Enclosing作用域;Global
倒數第二次被搜索,包含當前模塊全局名字的作用域;Built-in
最後被搜索,包含內建名字的最外層作用域。
程式運行時,LGB
三個作用域是一定存在的,E
作用域不一定存在;若程式是這樣的:
i = 1
print(i)
局部作用域在哪裡呢?我們認為(Python Scopes And Namespaces):
Usually, the local scope references the local names of the (textually) current function. Outside functions, the local scope references the same namespace as the global scope: the module’s namespace. Class definitions place yet another namespace in the local scope.
一般地,局部作用域引用函數中定義的名字。函數之外,局部作用域和全局作用域引用同一個命名空間:模塊的明星空間。然而類型的局部作用域引用了類定義新的命名空間。
Python
按照以上L-E-G-B
的順序依次在四個作用域搜索名字。沒有搜索到時,Python
拋出NameError
異常。
2.4 何時引入作用域
我們知道:
在
Python
中一個名字只有在定義之後,才能引用。
print(i)
直接引用未定義的名字i
,按照搜索規則,在LGB
三個作用域均沒有搜索到名字i
(LB
相同命名空間)。拋出NameError
異常:
Traceback (most recent call last):
File "scope_test.py", line 15, in <module>
print(i)
NameError: name 'i' is not defined
那對於這段代碼呢?
def try_to_define_name():
'''函數中定義了名字i,並綁定了一個整數對象1'''
i = 1
try_to_define_name()
print(i) #引用名字i之前,調用了函數
在引用名字i
之前,明明調用了函數,定義了名字i
,可是還是找不到這個名字:
Traceback (most recent call last):
File "scope_test.py", line 20, in <module>
print(i) #引用名字i之前,調用了函數
NameError: name 'i' is not defined
雖然定義了名字i
,但是定義在了函數的局部作用域對應的局部命名空間中,按照LEGB
搜索規則,在全局作用域中自然訪問不到局部作用域;再者,函數調用結束後,這個命名空間被銷毀了。
引用名字總是與作用域相關的,因此:
在
Python
中一個名字只有在定義之後,才能在合適的作用域引用。
那麼,在定義名字時,就要註意名字定義的作用域了,以免定義後需要訪問時卻找不到。所以,瞭解Python
在何時會引入新的作用域很有必要。一般來說,B,G
兩個作用域的引入在不能夠通過代碼操作的,能夠通過語句引入的作用域只有E,L
了。Python
中引入新作用域的語句很有限,總的來說只有兩類一個:
- 函數定義引入
local
作用域或者Enclosing
作用域;本質上,lambda
和生成器表達式也是函數,會引入新作用域。 - 類定義引入
local
作用域; - 列表推導式引入
local
作用域,傳說在python2
中列表推導式不引入新的作用域
幾個會讓有其他高級語言經驗的猿困惑的地方:
if
語句:
if True:
i = 1
print(i) # output: 1,而不是NameError
if
語句並不會引入新的作用域,所以名字綁定語句i = 1
與print(i)
是在同一個作用域中。
for
語句:
for i in range(6):
pass
print(i) #output: 5,而不是NameError
for
語句同樣不會引入新的作用域,所以名字i
的綁定和重綁定與print(i)
在同一個作用域。這一點Python
就比較坑了,因此寫代碼時切忌for
迴圈名字要與其他名字不重名才行。
import
語句:
def import_sys():
'''import sys module'''
import sys
import_sys()
print(sys.path) # NameError: name 'sys' is not defined
這個算非正常程式員的寫法了,在另一篇文章《Python進階 - 對象,名字以及綁定》中介紹過,import
語句在函數import_sys
中將名字sys
和對應模塊綁定,那sys
這個名字還是定義在局部作用域,跟上面的例子沒有任務區別。要時刻切記Python
的名字,對象,這個其他編程語言不一樣,但是:
打破第一編程語言認知的第二門編程語言,才是值得去學的好語言。
3. 作用域應用
3.1 自由變數可讀不可寫
我不太想用“變數”這個詞形容名字,奈何變數是家喻戶曉了,Python
中的自由變數:
If a variable is used in a code block but not defined there, it is a free variable.
如果引用發生的代碼塊不是其定義的地方,它就是一個自由變數。專業一點,就是:
引用名字的作用域中沒有這個名字,那這個名字就是自由名字
Note: “自由名字”只是作者YY的,並沒得到廣泛認可。
我們已經瞭解了作用域有LEGB
的層次,並按順序搜索名字。按照搜索順序,當低層作用域不存在待搜索名字時,引用高層作用域存在的名字,也就是自由名字:
[示例1]
def low_scope():
print(s)
s = 'upper scope'
low_scope()
很清楚,這段代碼的輸出是upper scope
。
[示例2]
def low_scope():
s = 'lower scope'
s = 'upper scope'
low_scope()
print(s)
很遺憾,最後的列印語句沒有按照期待列印出lower scope
而是列印了upper scope
。
A special quirk of Python is that – if no global statement is in effect – assignments to names always go into the innermost scope.
Python
的一個怪癖是,如果沒有使用global
語句,對名字的賦值語句通常會影響最內層作用域。
即賦值語句影響局部作用域,賦值語句帶來的影響是綁定或重綁定,但是在當前局部作用域的命名空間中,並沒有s
這個名字,因此賦值語句在局部作用於定義了同名名字s
,這與外層作用域中的s
並不衝突,因為它們分屬不同命名空間。
這樣,全局作用域的s
沒有被重綁定,結果就很好解釋了。
當涉及可變對象時,情況又有所不同了:
[示例3]
def low_scope():
l[0] = 2
l = [1, 2]
low_scope()
print(l) # [2, 2]
很遺憾,最後的列印語句沒有按照期待輸出[1, 2]
而是輸出了[2, 2]
。
上一個例子的經驗並不能運用在此,因為list
作為一個可變對象,l[0] = 2
並不是對名字l
的重綁定,而是對l
的第一個元素的重綁定,所以沒有新的名字被定義。因此在函數中成功更新了全局作用於中l
所引用對象的值。
註意,下麵的示例跟上面的是不一樣的:
[示例4]
def low_scope():
l = [2, 2]
l = [1, 2]
low_scope()
print(l) # [1, 2]
我們可以用本節中示例1的方法解釋它。
綜上,可以認為:
自由變數可讀不可寫。
3.2 global
和nonlocal
總是存在打破規則的需求:
在低層作用域中需要重綁定高層作用功能變數名稱字,即通過自由名字重綁定。
global_stmt ::= "global" identifier ("," identifier)*
The global statement is a declaration which holds for the entire current code block. It means that the listed identifiers are to be interpreted as globals. It would be impossible to assign to a global variable without global, although free variables may refer to globals without being declared global.
global
語句是適用於當前代碼塊的聲明語句。列出的標識符被解釋為全局名字。雖然自由名字可以不被聲明為global
就能引用全局名字,但是不使用global
關鍵字綁定全局名字是不可能的。
nonlocal_stmt ::= "nonlocal" identifier ("," identifier)*
The nonlocal statement causes the listed identifiers to refer to previously bound variables in the nearest enclosing scope excluding globals. This is important because the default behavior for binding is to search the local namespace first. The statement allows encapsulated code to rebind variables outside of the local scope besides the global (module) scope.
nonlocal
語句使得列出的名字指向最近封閉函數中綁定的名字,而不是全局名字。預設的綁定行為會首先搜索局部作用域。nonlocal
語句使得在內層函數中重綁定外層函數作用域中的名字成為可能,即使同名的名字存在於全局作用域。
經典的官方示例:
def scope_test():
def do_local():
spam = 'local spam'
def do_nonlocal():
nonlocal spam # 當外層作用域不存在spam名字時,nonlocal不能像global那樣自作主張定義一個
spam = 'nonlocal spam' # 自由名字spam經nonlocal聲明後,可以做重綁定操作了,可寫的。
def do_global():
global spam # 即使全局作用域中沒有名字spam的定義,這個語句也能在全局作用域定義名字spam
spam = 'global spam' # 自有變數spam經global聲明後,可以做重綁定操作了,可寫的。
spam = 'test spam'
do_local()
print("After local assignment:", spam) # After local assignment: test spam
do_nonlocal()
print("After nonlocal assignment:", spam) # After nonlocal assignment: nonlocal spam
do_global()
print("After global assignment:", spam) # After global assignment: nonlocal spam
scope_test()
print("In global scope:", spam) # In global scope: global spam
作者說不行nonlocal
的邪:
def nest_outter():
spam = 'outer'
def nest_inner():
nonlocal spam1
spam1 = 'inner'
nest_inner()
print(spam)
nest_outter()
Output:
File "scope_test.py", line 41
nonlocal spam1
SyntaxError: no binding for nonlocal 'spam1' found
4. 一些坑
作者曾經自信滿滿認為透徹瞭解了Python
的作用域,但是一大堆坑踩得觸不及防。
4.1 坑1 - UnboundLocalError
def test():
print(i)
i = 1
i = 2
test()
Output:
Traceback (most recent call last):
File "scope_test.py", line 42, in <module>
test()
File "scope_test.py", line 38, in test
print(i)
UnboundLocalError: local variable 'i' referenced before assignment
其實忽略掉全局作用域中i = 2
這條語句,都可以理解。
Usually, the local scope references the local names of the (textually) current function.
Python
對局部作用域情有獨鍾,解釋器執行到print(i)
,i
在局部作用域沒有。解釋器嘗試繼續執行後面定義了名字i
,解釋器就認為代碼在定義之前就是用了名字,所以拋出了這個異常。如果解釋器解釋完整個函數都沒有找到名字i
,那就會沿著搜索鏈LEGB
往上找了,最後找不到拋出NameError
異常。
4.2 坑2 - 類的局部作用域
class Test(object):
i = 1
def test_print(self):
print(i)
t = Test()
i = 2
t.test_print()
我就問問大家,這個輸出什麼?
當然會出乎意料輸出2
了,特別是有其他語言經驗的人會更加困惑。
上文強調過:
函數命名空間的生命周期是什麼? 調用開始,返回或者異常結束,雖然示例中是調用的方法,但其本質是調用類的函數。
類命名空間的作用域是什麼?類定義開始,類完成定義結束。
類定義開始時,創建新的屬於類的命名空間,用作局部作用域。類定義完後,命名空間銷毀,沒有直接方法訪問到類中的i
了(除非通過間接訪問的方式:Test.i
)。
方法調用的本質是函數調用:
class Test(object):
i = 1
def test_print(self):
print(i)
t = Test()
i = 2
# t.test_print()
Test.test_print(t) # 方法調用最後轉換成函數調用的方式
函數調用開始,其作用域與全局作用域有了上下級關係(L
和G
),函數中i
作為自由名字,最後輸出2
。
因此,不能被類中數據成員和函數成員的位置迷惑,始終切記,Python
中兩種訪問引用的方式:
直接引用:試圖直接寫名字
name
引用名字,Python
按照搜索LEGB
作用域的方式搜索名字。間接引用:使用
objname.attrname
的方式引用名字attrname
,Python
不搜索作用域,直接去對象里找屬性。
4.3 坑3 - 列表推導式的局部作用域
一個正常列表推導式:
a = 1
b = [a + i for i in range(10)]
print(b) # [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
現在把列表推導式放到類中:
class Test(object):
a = 1
b = [a + i for i in range(10)]
print(b)
def test(self):
pass
Output:
Traceback (most recent call last):
File "scope_test.py", line 15, in <module>
class Test(object):
File "scope_test.py", line 18, in Test
b = [a + i for i in range(10)]
File "scope_test.py", line 18, in <listcomp>
b = [a + i for i in range(10)]
NameError: name 'a' is not defined
輸出反饋名字a
未定義。
上文強調過,解釋器讀取類定義開始class ClassName
後,創建命名空間用作局部作用域。
語句a = 1
,在這個局部作用域中定義了名字i
語句b = [a + i for i in rage(10)]
,列表推導式同樣創建了一個局部作用域。這個作用域與類定義的局部作用域並沒有上下級關係,所以,自然沒有任何直接訪問名字a
的方法。
Python
中只有四種作用域:LEGB
,因為類定義的局部作用域與列表推導式的局部作用域於不是嵌套函數關係,所以並不能構成Enclosing
作用域關係。因此它們是兩個獨立的局部作用域,不能相互訪問。
既然是兩個獨立局部作用域,那麼上述例子就等同於:
def test1():
i = 1
def test2():
print(i)
test1()
test2()
期待在test2
中訪問test1
的名字i
,顯然是不可行的。