# Python 3.12 搶先看——關於 f-string 的改動 哈嘍大家好,我是鹹魚 相信小伙伴們對 python 中的 f-string 都不陌生 f-string 是格式化字元串的縮寫,是以小寫或大寫字母 F 為首碼的字元串文本 f-string 提供簡潔明瞭的語法,**允許對變數和表達式 ...
Python 3.12 搶先看——關於 f-string 的改動
哈嘍大家好,我是鹹魚
相信小伙伴們對 python 中的 f-string 都不陌生
f-string 是格式化字元串的縮寫,是以小寫或大寫字母 F 為首碼的字元串文本
f-string 提供簡潔明瞭的語法,允許對變數和表達式進行插值
那對於還在即將發佈的還在測試階段的 python 3.12 版本中,f-string 有哪些改動?python 3.12 版本之前的 f-string 又有哪些限制?
閑話少說,我們直接進入正文
原文鏈接:https://realpython.com/python312-f-strings/
f-string 在 python 3.12 之前的限制
我們可以使用 Python 的 f-string 進行字元串格式化和插值,f-string 是以字母 F (大寫小寫都行)為首碼的字元串文本
這種文本允許插入變數和表達式,Python 會對其進行評估以生成最終字元串
自從在 Python 3.6 版本中引入以來,f-string 在 Python 社區內已經廣泛流行起來。人們對它們的採納熱情高漲,並將其作為現代 Python 編程的標準
這其中的原因是什麼呢?
這是因為 f-string 提供了一種簡潔而易讀的語法,允許我們格式化字元串並插入變數和表達式,而無需使用傳統的.format()
方法或舊式的字元串格式運算符(%)
然而,為了引入 f-string,CPython 核心開發團隊必須做出關鍵的決策,特別是在解析f字元串時,所以 f-string 有自己的解析代碼
換句話說,CPython 有一個專用的 f-string 解析器。因此,f-string 語法不是官方 Python 語法的一部分
從核心開發人員的角度來看,這樣的實現決策意味著相當大的維護成本,因為他們必須手動維護一個單獨的解析器
而且不作為官方語法的一部分,也意味著其他 Python 實現,如 PyPy,無法確定他們是否正確實現了 f-string
然而,最重要的負擔在於用戶方面。從用戶的角度來看,當前的 f-string 實現施加了一些限制:
- 無法重覆使用引號或字元串分隔符
- 無法嵌入反斜杠,這意味著不能使用轉義字元
- 禁止添加內聯註釋
- f-string 的嵌套僅限於 Python 中可用的引用變體
PEP 536 列出了這些限制。接下來我們通過一些小示例來瞭解這些限制如何影響我們在 Python 中使用 f-string
示例中使用的是 python 3.11 版本,如果使用較低的版本可能會導致輸出不一樣
我們首先在 f-string 中插入字典的 key
>>> employee = {
... "name": "John Doe",
... "age": 35,
... "job": "Python Developer",
... }
>>> f"Employee: {employee["name"]}"
File "<stdin>", line 1
f"Employee: {employee["name"]}"
^^^^
SyntaxError: f-string: unmatched '['
在上面的示例中,我們嘗試在 f-string 中插入員工姓名,但是報錯了
因為 "name"
鍵周圍的雙引號會破壞字元串文本(f-string 無法重覆使用引號或字元串分隔符)
若要解決此問題,需要使用不同類型的引號來分隔鍵
我們將雙引號用於 f-string ,單引號用於字典 key,這下就不會報錯了
>>> f"Employee: {employee['name']}"
'Employee: John Doe'
f-string 的第二個限制是不能在嵌入式表達式中使用反斜杠字元
>>> words = ["Hello", "World!", "I", "am", "a", "Pythonista!"]
>>> f"{'\n'.join(words)}"
File "<stdin>", line 1
f"{'\n'.join(words)}"
^
SyntaxError: f-string expression part cannot include a backslash
我們看到上面的示例得到了一個 SyntaxError
,因為 f-string 不允許在由大括弧分隔的表達式中使用反斜杠字元
我們可以通過下麵的方法來實現,但他並不優美
>>> word_lines = "\n".join(words)
>>> f"{word_lines}"
'Hello\nWorld!\nI\nam\na\nPythonista!'
>>> print(f"{word_lines}")
Hello
World!
I
am
a
Pythonista!
f-string 的另一個限制是它們不允許在嵌入式表達式中插入註釋
雖然這種限制可能看起來是多餘的,但在某些情況下,一個好的註釋可以幫助其他開發人員更好地理解你的代碼
>>> employee = {
... "name": "John Doe",
... "age": 35,
... "job": "Python Developer",
... }
>>> f"""Storing employee's data: {
... employee['name'].upper() # Always uppercase name before storing
... }"""
File "<stdin>", line 3
}"""
^
SyntaxError: f-string expression part cannot include '#'
在上面的示例中,我們使用了三引號生成多行的字元串,當我們嘗試增加註釋時,程式卻報錯了
最後,f-string 還有另一個限制——f-string中的嵌套級別數受 Python 中可用的字元串分隔符的限制,這些分隔符是 "
、 '
、 """
和 '''
>>> f"""{
... f'''{
... f"{f'{42}'}"
... }'''
... }"""
'42'
>>> f"""{
... f'''{
... f"{f'{f"{42}"}'}"
... }'''
... }"""
File "<stdin>", line 1
(f"{f'{f"{42}"}'}")
^
SyntaxError: f-string: f-string: unterminated string
儘管嵌套 f-string 可能沒有很多用例,但如果我們在特定用例中需要額外的嵌套級別,那麼就不走運了,因為不能重用引號
需要註意的是:只有三引號的 f-string 可以跨越多行,但是這個是 python 字元串的特征
雖然 f-string 字元串非常酷,大多數 Python 開發人員都喜歡它們,但上面這些限制讓 f-string 感覺不完整,並且與 Python 本身的一般行為不一致
幸運的是,Python 在不斷改進,下一個版本 3.12 正在解除這些限制使 f-string 變得更好
Python 3.12 中 f-string 的改動
- 可重覆使用引號,不再嚴格區分雙引號單引號
在新的 f-string 實現中,嵌入的表達式組件可以包含任何 Python 表達式,包括使用與包含的 f-string 相同類型的引號的字元串文本
>>> employee = {
... "name": "John Doe",
... "age": 35,
... "job": "Python Developer",
... }
>>> f"Employee: {employee["name"]}"
'Employee: John Doe'
在上面的示例中,我們使用了雙引號來定義 f-string 並分隔 employee
字典鍵
現在,在嵌入式表達式中使用字元串文本時,不必切換到其他類型的引號
儘管這種新行為看起來很酷且一致,但有些人認為在同一 f-string 中重用引號令人困惑且難以閱讀
這些人可能是對的——重用引號違反了 Python 規則,即匹配的引號對分隔字元串
但是,專註於將純字元串部分與嵌入的表達式部分分開有助於提高可讀性
在這方面,PEP 701 的作者說:
We believe that forbidding quote reuse should be done in linters and code style tools and not in the parser, the same way other confusing or hard-to-read constructs in the language are handled today
我們認為,禁止引用重用應該在 linters 和代碼樣式工具中完成,而不是在解析器中,就像今天處理語言中其他令人困惑或難以閱讀的結構一樣
這種說法是有道理的。但是最佳做法和樣式建議可能依舊是在代碼中避免使用它們
因此,如果發現重用引號不可讀或令人困惑,那就堅持在 f-string 中使用不同引號的舊做法
- 允許使用反斜杠
f-string 不支持反斜杠是 Python 3.11 及更低版本中的另一個問題,在 Python 3.12 中,此問題已解決
>>> words = ["Hello", "World!", "I", "am", "a", "Pythonista!"]
>>> f"{'\n'.join(words)}"
'Hello\nWorld!\nI\nam\na\nPythonista!'
>>> print(f"{'\n'.join(words)}")
Hello
World!
I
am
a
Pythonista!
能夠在嵌入在 f-string 中的表達式中包含反斜杠是一個很好的進步,它省去了我們尋找替代解決方法的工作量
- 支持多行實現和註釋
f-string 還允許在這些表達式中使用多行表達式和內聯註釋
>>> f"""Storing employee's data: {
... employee['name'].upper() # Always uppercase name before storing
... }"""
"Storing employee's data: JOHN DOE"
在 Python 3.12 的 f-string 中,我們可以定義跨越多個物理行的表達式。如果需要,每行都可以包含內聯註釋
- 實現任意級別的 f-string 嵌套
由於允許引號重用,新的 f-string 允許任意級別的嵌套
此功能的實用性有限,因為許多級別的嵌套可能會使代碼難以閱讀和理解
>>> f"{
... f"{
... f"{
... f"{
... f"{
... f"Deeply nested f-string!"
... }"
... }"
... }"
... }"
... }"
'Deeply nested f-string!'
在上面的示例中,我們註意到新的 f-string 允許在表達式中的大括弧內使用換行符,這個跟常規 python 規範一致(常規 python 允許我們將表達式括在一對括弧中,使其能夠跨越多行)
- 更具體更清晰的報錯信息
Python 3.12 的新 f-string 消除瞭如何在現實代碼中使用 f-string 的幾個限制並且將其變成了新功能
但遠不止於此
以前,這些增強的錯誤消息不適用於 f-string,因為它們不使用 PEG 解析器
因此,在 Python 3.12 之前,與 f-string 相關的錯誤消息不太具體和清晰
Python 開發團隊在引入 PEG 解析器後投入了大量工作來改進 Python 錯誤消息,現在使用 PEG 解析器來解析新的 f-string 語法,所以你會得到一個額外的、顯著的好處——更具體更清晰的報錯信息
例如,比較以下 f-string 在 3.11 與 3.12 中生成的錯誤消息
>>> # Python 3.11
>>> f"{42 + }"
File "<stdin>", line 1
(42 + )
^
SyntaxError: f-string: invalid syntax
>>> # Python 3.12
>>> f"{42 + }"
File "<stdin>", line 1
f"{42 + }"
^
SyntaxError: f-string: expecting '=', or '!', or ':', or '}'
第一個示例中的錯誤消息是通用的,不指向違規行中錯誤的確切位置。此外,表達式在括弧中,這會增加問題的噪音,因為原始代碼不包含括弧
在 Python 3.12 中,錯誤消息更加精確。它指示問題在受影響管中的確切位置。此外,異常消息提供了一些可能有助於我們解決問題的建議
Python 3.12 的 f-string 仍有不足
新的 f-string 不會消除 f-string 的一些當前限制
例如,有關使用冒號 ( :
)、感嘆號 ( !
) 和轉義帶反斜杠的大括弧的規則仍然存在
要將冒號和感嘆號 ( :
!
) 用於字元串格式以外的目的,我們需要用一對括弧將包含這些符號之一的表達式括起來。否則,f-string 將不起作用
根據PEP 701的作者的說法,這就是他們沒有取消限制的原因:
The reason is that this [removing the restriction] will introduce a considerable amount of complexity [in the f-string parsing code] for no real benefit.
原因是這[刪除限制]將[在f字元串解析代碼中]引入相當大的複雜性,而沒有真正的好處
除了將這些字元用於字元串格式化之外,我們幾乎找不到適合它們的用例。即使是 PEP 701 中的相關示例也毫無用處
>>> # Python 3.11
>>> f"Useless use of lambdas: { lambda x: x*2 }"
File "<stdin>", line 1
( lambda x)
^
SyntaxError: f-string: invalid syntax
>>> # Python 3.12
>>> f"Useless use of lambdas: { lambda x: x*2 }"
File "<stdin>", line 1
f'Useless use of lambdas: { lambda x: x*2 }'
^^^^^^^^^
SyntaxError: f-string: lambda expressions are not allowed without parentheses
在上面的示例中,我們使用冒號作為匿名函數的一部分,但是卻報錯了
如果要避免這個錯誤,我們必須用括弧括起來
>> f"Useless use of lambdas: { (lambda x: x*2) }"
'Useless use of lambdas: <function <lambda> at 0x1010747c0>'
最後,新的 f-string 允許我們使用反斜杠轉義字元,但不允許使用反斜杠轉義大括弧:
>>> f"\{ 42 \}"
File "<stdin>", line 1
f"\{ 42 \}"
^
SyntaxError: unexpected character after line continuation character
在此示例中,我們嘗試使用反斜杠來轉義大括弧。但是,代碼不起作用
以下是 PEP 701 的作者對此限制的看法:
We have decided to disallow (for the time being) using escaped braces (
\{
and\}
) in addition to the{{
and}}
syntax. Although the authors of the PEP believe that allowing escaped braces is a good idea, we have decided to not include it in this PEP, as it is not strictly necessary for the formalization of f-strings proposed here, and it can be added independently in a regular CPython issue我們決定(暫時)禁止使用轉義大括弧(
\{
和\}
)以及{{
和}}
語法。儘管 PEP 的作者認為允許轉義大括弧是個好主意,但我們決定不將其包含在此 PEP 中,因為它對於此處提出的 f-string 的形式化並不是絕對必要的,並且可以在常規的 CPython 問題中獨立添加
如果要轉義 f-string 中的大括弧,需要在外面多加一層大括弧
>>> f"{{ 42 }}"
'{ 42 }'
將大括弧加倍是目前版本在 f-string 中轉義這些字元的方法,但是將來可能會改變