原作:Jake Edge 譯者:豌豆花下貓@Python貓 英文:https://lwn.net/Articles/819853/ 隨著 Python 3.9.0b1 的發佈,即開發周期中計劃的四個 beta 版本的首個,Python 3.9 的功能已經是完善了。在 10 月發佈最終版本之前,還會有 ...
原作:Jake Edge
譯者:豌豆花下貓@Python貓
英文:https://lwn.net/Articles/819853/
隨著 Python 3.9.0b1 的發佈,即開發周期中計劃的四個 beta 版本的首個,Python 3.9 的功能已經是完善了。在 10 月發佈最終版本之前,還會有許多測試和穩定性方面的工作要做。
(譯註:beta1 版本發佈於 5 月 18 日,作者文章寫於 5 月 20,而到本篇譯文發佈時,beta2 剛好在今天即 6 月 9 日發佈,這是一個巧合!)
該發佈說明中列出了被 3.9 接受的 7 個 Python 增強提案(PEP)。我們研究了其中的一些 PEP,看到有一些更新。現在似乎是一個介紹 Python 3.9 帶來的一些東西的好時機。
1、字元串操作
有時最簡單(表明上的)的事情最困難,或者至少會引起巨大的討論。其中大部分的爭議是關於命名(還能是什麼?),但是給標準字元串對象添加函數,來刪除首碼和尾碼,這種想法是毫無爭議的。
是否可以將那些詞綴(首碼和尾碼的統稱)指定為序列,以便在一次調用中處理多個詞綴,這一點尚不明確,最後它被從提案中刪除了,等待著其他人再次推動更改。
在 3 月底,Dennis Sweeney 在 python-dev 郵件列表上請求核心開發者支持 PEP 616(“字元串刪除首碼和尾碼的方法”)。他指出了自 2019 年 3 月以來關於該話題的 python-ideas 討論。埃里克·史密斯(Eric V. Smith)同意支持該 PEP,這促使 Sweeney 發佈並啟動了討論。
在最初版本中,他使用 cutprefix() 和 cutsuffix() 作為要添加給字元串對象的方法名。四種類型的 Python 對象將獲得新的方法:str(Unicode 字元串),byte(二進位序列),bytearray(可變的二進位序列)和 collections.UserString(字元串對象的一種封裝)。
它的寫法如下:
'abcdef'.cutprefix('abc') # 返回'def'
'abcdef'.cutsuffix('ef') # 返回'abcd'
針對命名部分,出現了一大堆的建議。基本上很少有人喜歡“cut”,因此“strip”、“strim”和“remove”被提出來了,並且都獲得了一些支持。
stripprefix() 以及 stripsuffix() 由於 PEP 中指出的一種理由,至少是被部分地反對了;現有的“strip”函數令人困惑,因此應避免重用該名稱。
str.lstrip() 和 str.rstrip() 方法也用於刪除前導字元和尾隨字元,但是它們對於真正在尋找 cutprefix() 功能的程式員來說是一個困惑的來源。
*strip() 在調用時接收一個字元串參數,但會將其視為一組字元,並從字元串開頭或結尾消除:
'abcdef'.lstrip('abc') # 返回“def”,符合預期
'abcbadefed'.lstrip('abc') # 返回'defed',完全不符合預期
最終,removeprefix() 和 removesuffix() 似乎占據了上風,這正是 Sweeney 最終改成的版本。Guido van Rossum 也支持這些名字。
埃里克·法格倫(Eric Fahlgren)這樣搞笑地總結了命名的爭論:
我認為如果你先寫文檔,則名稱的選擇會更容易些:
cutprefix - 刪除指定的首碼。
trimprefix - 刪除指定的首碼。
stripprefix - 刪除指定的首碼。
removeprefix - 刪除指定的首碼。廢話