花下貓語:本文是學習群內 櫻雨樓 小姐姐的投稿。之前已發佈過她的一篇作品《 "當談論迭代器時,我談些什麼?" 》,大受好評。本文依然是對比 C++ 與 Python,來探討編程語言中極其重要的概念。祝大家讀有所獲,學有所成! 櫻雨樓 | 原創作者 豌豆花下貓 | 編輯潤色 本文原創並首發於公眾號【 ...
花下貓語:本文是學習群內 櫻雨樓 小姐姐的投稿。之前已發佈過她的一篇作品《當談論迭代器時,我談些什麼?》,大受好評。本文依然是對比 C++ 與 Python,來探討編程語言中極其重要的概念。祝大家讀有所獲,學有所成!
櫻雨樓 | 原創作者
豌豆花下貓 | 編輯潤色
本文原創並首發於公眾號【Python貓】,未經授權,請勿轉載。
原文地址:https://mp.weixin.qq.com/s/k0VNL6uyvBHT7PWdzEPROQ
0 引言
指針(Pointer)是 C、C++ 以及 Java、Go 等語言的一個非常核心且重要的概念,而引用(Reference)是在指針的基礎上構建出的一個同樣重要的概念。
指針對於任何一個編程語言而言都是必須且重要的,雖然 Python 對指針這一概念進行了刻意的模糊與限制,但指針對於 Python 而言依然是一個必須進行深入討論的話題。
本文基於 C++ 與 Python,討論了 Python 中與指針及引用相關的一些行為。
1 什麼是指針?為什麼需要指針?
指針有兩重含義:
(1)指代某種數據類型的指針類型,如整形指針類型、指針指針類型
(2)指代一類存放有記憶體地址的變數,即指針變數
指針的這兩重含義是緊密聯繫的:作為一種變數,通過指針可以獲取某個記憶體地址,從而為訪問此地址上的值做好了準備;作為一種類型,其決定了記憶體地址的正確偏移長度,其應等於當前類型的單位記憶體大小。
如果一個指針缺少指針類型,即 void *,則顯然,其雖然保存了記憶體地址,但這僅僅是一個起點地址,指針會因為無法獲知從起點向後進行的偏移量,從而拒絕解指針操作;而如果一個指針缺少地址,即 nullptr,則其根本無法讀取特定位置的記憶體。
指針存在的意義主要有以下幾點:
- 承載通過 malloc、new、allocator 等獲取的動態記憶體
- 使得 pass-by-pointer 成為可能
pass-by-pointer 的好處包括但不限於:
- 避免對實參無意義的值拷貝,大幅提高效率
- 使得對某個變數的修改能力不局限於變數自身的作用域
- 使得 swap、移動構造函數、移動賦值運算等操作可以僅針對數據結構內部的指針進行操作,從而避免了對臨時對象、移後源等對象的整體記憶體操作
由此可見,與指針相關的各操作對於編程而言都是必須的或十分重要的。
2 C++中的引用
在 C++ 中,引用具有與指針相似的性質,但更加隱形與嚴格。C++ 的引用分為以下兩種:
2.1 左值引用
左值引用於其初始化階段綁定到左值,且不存在重新綁定。
左值引用具有與被綁定左值幾乎一樣的性質,其唯一的區別在於 decltype 聲明:
int numA = 0, &lrefA = numA; // Binding an lvalue
cout << ++lrefA << endl; // Use the lvalue reference as lvalue & rvalue
decltype(lrefA) numB = 1; // Error!
左值引用常用於 pass-by-reference:
void swap(int &numA, int &numB)
{
int tmpNum = numA;
numA = numB;
numB = tmpNum;
}
int main()
{
int numA = 1, numB = 2;
swap(numA, numB);
cout << numA << endl << numB << endl; // 2 1
}
2.2 右值引用
右值引用於其初始化階段綁定到右值,其常用於移動構造函數和移動賦值操作。在這些場合中,移動構造函數和移動賦值操作通過右值引用接管被移動對象。
右值引用與本文內容無關,故這裡不再詳述。
3 Python中的引用
3.1 Python不存在引用
由上文討論可知,雖然“引用”對於 Python 而言是一個非常常用的術語,但這顯然是不准確的——由於 Python 不存在對左/右值的綁定操作,故不存在左值引用,更不存在右值引用。
3.2 Python的指針操作
不難發現,雖然 Python 沒有引用,但其變數的行為和指針的行為具有高度的相似性,這主要體現在以下方面:
- 在任何情況下(包括賦值、實參傳遞等)均不存在顯式值拷貝,當此種情況發生時,只增加了一次引用計數
- 變數可以進行重綁定(對應於一個不含頂層 const(top-level const)的指針)
- 在某些情況下(下文將對此問題進行詳細討論),可通過函數實參修改原值
由此可見,Python 變數更類似於(某種殘缺的)指針變數,而不是引用變數。
3.2.1 構造函數返回指針
對於 Python 的描述,有一句非常常見的話:“一切皆對象”。
但在這句話中,有一個很重要的事實常常被人們忽略:對象是一個值,不是一個指針或引用。
所以,這句話的準確描述應該更正為:“一切皆(某種殘缺的)指針”。雖然修改後的描述很抽象,但這是更準確的。
而由於對象從構造函數而來,至此我們可知:Python 的構造函數將構造匿名對象,且返回此對象的一個指針。
這是 Python 與指針的第一個重要聯繫。
用代碼描述,對於Python代碼:
sampleNum = 0
其不類似於 C++ 代碼:
int sampleNum = 0;
而更類似於:
int __tmpNum = 0, *sampleNum = &__tmpNum;
// 或者:
shared_ptr<int> sampleNum(new int(0));
3.2.2 __setitems__操作將隱式解指針
Python 與指針的另一個重要聯繫在於 Python 的隱式解指針行為。
雖然 Python 不存在顯式解指針操作,但(有且僅有)__setitems__操作將進行隱式解指針,通過此方法對變數進行修改等同於通過解指針操作修改變數原值。
此種性質意味著:
- 任何不涉及__setitems__的操作都將成為指針重綁定。
對於Python代碼:
numList = [None] * 10
# Rebinding
numList = [None] * 5
其相當於:
int *numList = new int[10];
// Rebinding
delete[] numList;
numList = new int[5];
delete[] numList;
由此可見,對 numList 的非__setitems__操作,導致 numList 被綁定到了一個新指針上。
- 任何涉及__setitems__的操作都將成為解指針操作。
由於 Python 對哈希表的高度依賴,“涉及__setitems__的操作”在 Python 中實際上是一個非常廣泛的行為,這主要包括:
- 對數組的索引操作
- 對哈希表的查找操作
- 涉及__setattr__的操作(由於 Python 將 attribute 存儲在哈希表中,所以__setattr__操作最終將是某種__setitems__操作)
我們用一個稍複雜的例子說明這一點:
對於以下Python代碼:
class Complex(object):
def __init__(self, real = 0., imag = 0.):
self.real = real
self.imag = imag
def __repr__(self):
return '(%.2f, %.2f)' % (self.real, self.imag)
def main():
complexObj = Complex(1., 2.)
complexObj.real += 1
complexObj.imag += 1
# (2.00, 3.00)
print(complexObj)
if __name__ == '__main__':
main()
其相當於:
class Complex
{
public:
double real, imag;
Complex(double _real = 0., double _imag = 0.): real(_real), imag(_imag) {}
};
ostream &operator<<(ostream &os, const Complex &complexObj)
{
return os << "(" << complexObj.real << ", " << complexObj.imag << ")";
}
int main()
{
Complex *complexObj = new Complex(1., 2.);
complexObj->real++;
complexObj->imag++;
cout << *complexObj << endl;
delete complexObj;
return 0;
}
由此可見,無論是 int、float 這種簡單的 Python 類型,還是我們自定義的類,其構造行為都類似使用 new 構造對象並返回指針。
且在 Python 中任何涉及“.”和“[]”的操作,都類似於對指針的“->”或“*”解指針操作。
4 後記
本文探討了 Python 變數與指針、引用兩大概念之間的關係,主要論證了“Python 不存在引用 ”以及“Python 變數的行為類似於某種殘缺的指針 ”兩個論點。
所有論點均系作者個人觀點,如有錯誤,恭迎指正。
公眾號【Python貓】, 本號連載優質的系列文章,有喵星哲學貓系列、Python進階系列、好書推薦系列、技術寫作、優質英文推薦與翻譯等等,歡迎關註哦。