說道C++的指針,很多人都很頭疼,也很confuse。經常把它和變數名,引用(reference)等混淆,其實這最主要的原因是很多程式員對於基本知識的掌握有問題,從而導致的很多基本概念的混淆。本文就是從最基本的概念講起,著重分析和比較指針和引用。主要從以下幾個方面著重的講解: 1. 變數(varia ...
說道C++的指針,很多人都很頭疼,也很confuse。經常把它和變數名,引用(reference)等混淆,其實這最主要的原因是很多程式員對於基本知識的掌握有問題,從而導致的很多基本概念的混淆。本文就是從最基本的概念講起,著重分析和比較指針和引用。主要從以下幾個方面著重的講解:
1. 變數(variable)的表現形式;
2. 指針的結構和原理;
3. 引用的結構和原理;
4. 指針在Array中的應用和註意事項;
5. 指針不能dereference的幾種情況;
一:變數的形式
說道變數,很多人都覺得非常簡單,每天都在定義變數,應用變數。可是有沒有停下腳步細細的品味一下具體什麼是變數呢?變數(variable)的定義在電腦科學中到底是如何定義的?然後variable到底是在記憶體中如何存儲值的呢?那麼跟著上面的問題,我們來一一的解答,首先最重要的,variable的定義,當你申明一個變數的時候,電腦會將指定的一塊記憶體空間和變數名進行綁定;這個定義很簡單,但其實很抽象,例如:int x = 5; 這是一句最簡單的變數賦值語句了, 我們常說“x等於5”,其實這種說法是錯誤的,x僅僅是變數的一個名字而已,它本身不等於任何值的。這條statement的正確翻譯應該是:“將5賦值於名字叫做x的記憶體空間”,其本質是將值5賦值到一塊記憶體空間,而這個記憶體空間名叫做x。切記:x只是簡單的一個別名而已,x不等於任何值。其圖示如下:
變數在記憶體中的操作其實是需要經過2個步驟的:
1)找出與變數名相對應的記憶體地址。
2)根據找到的地址,取出該地址對應的記憶體空間裡面的值進行操作。
二:指針的結構和原理
首先介紹到底什麼是指針?指針變數和任何變數一樣,也有變數名,和這個變數名對應的記憶體空間,只是指針的特殊之處在於:指針變數相對應的記憶體空間存儲的值恰好是某個記憶體地址。這也是指針變數區別去其他變數的特征之一。例如某個指針的定義如下:
int x = 5; int *ptr = &x;
ptr即是一個指正變數名。通過指針獲取這個指針指向的記憶體中的值稱為dereference,這個的中文翻譯叫啥我也不知道。【慚愧】,哈哈。dereference
其相對於記憶體空間的表示如下:
特別提醒:這裡千萬千萬不要鑽進變數名x, ptr的牛角尖裡面,不要去思考這些變數名存儲在哪裡,變數名僅僅是一塊記憶體空間的代號名字而已,我們應該關心的是這些變數名相對應的記憶體地址。根據上面的分析可以看出,指針變數和任何變數在記憶體中的形式是相同的,僅僅在於其存儲的值比較特殊而已。
三:引用在記憶體中的結構和原理
引用(reference)在C++中也是經常被用到,尤其是在作為函數參數的時候,需要在函數內部修改更新函數外部的值的時候,可以說是引用場景非常豐富。但程式員一般很難或者不註意分析reference和pointer,只是知道怎麼應用而已,而不去具體分析這個reference。下麵我就來簡單的分析一下這個reference。首先我們必須明確的一點就是:reference是一種特殊的pointer。從這可以看出reference在記憶體中的存儲結構應該跟上面的指針是一樣的,也是存儲的一塊記憶體的地址。例如reference的定義如下:
int x = 5; int &y = x;
reference 和 pointer主要有以下3中不同點:
1)reference不需要dereference即可直接獲取到指向的記憶體空間的值。例如上例中,直接y就可以獲取reference y所指向的記憶體空間的值,而不需要*y來獲取。
2)reference的賦值操作也不需要取地址符來賦值,可以直接通過變數名,例如上例中,int &y = x, 而不需要 int &y = &x;
3) reference 在申明的時候就必須要有初始值,而且reference變數指向的記憶體地址是不能變化,不像pointer那樣可以很靈活的重新指向其他地址。
reference和pointer在記憶體中的結構和關係如下圖所示:
四:指針在Array中的應用和註意事項
在C++中,一個Array類型的變數arr, 其實本質是一個指向數組第一個元素的指針。字元串string在C++中其實就是一個char類型的array,例如:char arr[] = {'a','b','c','d','e','\0'};這就是表示的一串字元串“abcde”,其中arr[0],arr[1], arr[2]..........之間相差的數值可能並不一定是1byte, 要根據這個數組的類型來判斷,compiler會自動判斷它們之間的相差值的; 另外在c++中字元串也可以用string literals(求大神翻譯)的方式表示,即:char *arr2 = "abcde"; 但是通過string literal方式表示的字元串是read only的,不能修改的, 例如:*(arr2+1)= 'f'; 這句語句會產生error的。其在記憶體中的表現形式如下圖所示:
五:指針不能dereference的情況
但一個指針的值是invalid的時候,那麼這個指針是不能dereference的。那麼到底哪幾種情況是invalid的呢?主要有以下幾種情況:
1)當這個指針的值是NULL的時候,這個指針是不能dereference的。因為指針為NULL,即表示這個指針指向記憶體地址為0的地址塊,記憶體地址為0的記憶體空間是沒有值的,所以是不能dereference的; 例如:int *ptr = NULL; cout<<*ptr<<endl; 是錯誤的。
2)當某個指針被deallocte或者某個指針所在的記憶體空間被erase了的話,那麼這個指針也是不能被dereference的;例如下麵的代碼:
int *function(int a){ int temp = 5; return &temp; }
上面的代碼返回的指針也是不能dereference的,因為temp出了作用域後會被系統回收這一塊空間,temp所占的記憶體空間已經被erase了,所以它返回的指針是一個指向被erase了的記憶體空間。也是不能dereference的,否則會出錯。編譯階段會給出警告,在runtime的時候,如果dereference是會有error的。
好了C++的指針(pointer)和引用(reference)就先總結到這裡了。
如果有什麼問題歡迎大家的留言或者建議。謝謝