C Primer Plus 摘錄 第 10 章 數組和指針 10.1 數組 數組由數據類型相同的一系列元素組成。 通過聲明數組告訴編譯器數組中內含多少元素和這些元素的類型。 編譯器根據這些信息正確地創建數組。 float candy[365]; char code[12]; int states[5 ...
C Primer Plus 摘錄
第 10 章 數組和指針
10.1 數組
-
數組由數據類型相同的一系列元素組成。
-
通過聲明數組告訴編譯器數組中內含多少元素和這些元素的類型。 編譯器根據這些信息正確地創建數組。
float candy[365];
char code[12];
int states[50];
-
方括弧
[]
表明candy、 code和states都是數組, 方括弧中的數字表明數組中的元素個數。 -
要訪問數組中的元素, 通過使用數組下標數(也稱為索引) 表示數組中
的各元素。 數組元素的編號從0
開始。
10.1.1 初始化數組
- 用以逗號分隔的值列表(用花括弧括起來) 來初始化數組,各值之間用逗號分隔。
int powers[8] = {1,2,4,6,8,16,32,64};
-
推薦使用巨集定義數組長度,只需修改
#define
這行代碼即可 -
要創建只讀數組, 應該用
const
聲明和初始化數組
const int days[MONTHS] = {31,28,31,30,31,30,31,31,30,31,30,31};
-
存儲類別警告:數組和其他變數類似, 可以把數組創建成不同的存儲類別(storage class),第12章將介紹存儲類別的相關內容。本章描述的數組屬於自動存儲類別
-
當初始化列表中的值少於數組元素個數時, 編譯器會把剩餘的元素都初始化為
0
。 -
如果初始化列表的項數多於數組元素個數, 編譯器可沒那麼仁慈, 它會毫不留情地將其視為錯誤。
-
如果初始化數組時省略方括弧中的數字, 編譯器會根據初始化列表中的項數來確定數組的大小。
const int days[] = { 31, 28, 31, 30, 31, 30, 31, 31, 30, 31 };
sizeof days
是整個數組的大小(以位元組為單位),sizeof day[0]
是數組中一個元素的大小(以位元組為單位)。整個數組的大小除以單個元素的大小就是數組元素的個數。
10.1.2 指定初始化器(C99)
-
C99 增加了一個新特性: 指定初始化器(designated initializer) 。 利用該特性可以初始化指定的數組元素。
-
對於傳統的C初始化語法,要初始化指定元素,則必須同時初始化其之前的所有元素。
int arr[6] = {0,0,0,0,0,212}; // 傳統的語法
int arr[6] = {[5] = 212}; // 把arr[5]初始化為212
- 第一, 如果指定初始化器後面有更多的值, 如該例中的初始化列表中的片段:
[4] = 31,30,31
, 那麼後面這些值將被用於初始化指定元素後面的元素。 - 第二, 如果再次初始化指定的元素, 那麼最後的初始化將會取代之前的初始化。 如開始時把
days[1]
初始化為 28, 但是days[1]
又被後面的指定初始化[1] = 29
初始化為 29。
int days[MONTHS] = { 31, 28, [4] = 31, 30, 31, [1] = 29 };
10.1.3 給數組元素賦值
- 聲明數組後, 可以藉助數組下標(或索引) 給數組元素賦值。
10.1.4 數組邊界
-
在使用數組時, 要防止數組下標超出邊界。 也就是說, 必須確保下標是有效的值。
-
歸功於 C 信任程式員的原則。 不檢查邊界, C 程式可以運行更快。 編譯器不會檢查數組下標是否使用得當。 在C標準中, 使用越界下標的結果是未定義的。 這意味著程式看上去可以運行, 但是運行結果很奇怪, 或異常中止。
10.1.5 指定數組的大小
- 在C99標準之前, 聲明數組時只能在方括弧中使用「整型常量表達式」。 所謂整型常量表達式, 是由整型常量構成的表達式。
sizeof
表達式被視為整型常量, 但是(與C++不同)const
值不是。 另外, 表達式的值必須大於 0
int n = 5;
int m = 8;
float a1[5]; // 可以
float a2[5*2 + 1]; //可以
float a3[sizeof(int) + 1]; //可以
float a4[-4]; // 不可以, 數組大小必須大於0
float a5[0]; // 不可以, 數組大小必須大於0
float a6[2.5]; // 不可以, 數組大小必須是整數
float a7[(int)2.5]; // 可以, 已被強制轉換為整型常量
float a8[n]; // C99之前不允許
float a9[m]; // C99之前不允許
- C99標準允許這樣聲明, 這創建了一種新型數組, 稱為變長數組(variable-length array) 或簡稱 VLA(C11 放棄了這一創新的舉措, 把VLA設定為可選, 而不是語言必備的特性)。
- C99引入變長數組主要是為了讓C成為更好的數值計算語言。
10.2 多維數組
- 多維數組是這樣一種數組,它是一種數組,它的每個元素也是包含指定元素數量的數組。
float rain[5][12]; // 內含 5 個元素的數組, 每個元素本身是一個內含12個 float 類型值的數組
-
上述聲明中
rain[5]
表明rain
是一個內含 5 個元素的數組;float [12]
說明每個元素的類型是float[12]
-
rain[i]
是一個內含12個 float 類型值的數組,因此該數組的首元素就是rain[i][0]
,第 2 個元素是rain[0][1]
,以此類推,要訪問第 i 個數組的第 j 個元素(編號從 0 開始)即為rain[i][j]
-
該二維視圖有助於幫助讀者理解二維數組的兩個下標。 在電腦內部,這樣的數組是按順序儲存的, 從第1個內含12個元素的數組開始, 然後是第2個內含12個元素的數組, 以此類推。
-
遍歷二維數組常用兩個嵌套的
for
迴圈,一個迴圈處理數組的第1個下標, 另一個迴圈處理數組的第2個下標。
10.2.1 初始化二維數組
- 初始化二維數組是建立在初始化一維數組的基礎上。 首先, 初始化一維數組如下:
sometype ar1[5] = {val1, val2, val3, val4, val5};
- 對於二維數組
rain[5][12]
,rain是一個內含 5 個元素的數組, 每個元素又是內含12個float
類型元素的數組。 所以, 對rain
而言,val1
應該包含 12 個值, 用於初始化內含 12 個float
類型元素的一維數組。
const float rain[5][12] =
{
{4.3,4.3,4.3,3.0,2.0,1.2,0.2,0.2,0.4,2.4,3.5,6.6},
{8.5,8.2,1.2,1.6,2.4,0.0,5.2,0.9,0.3,0.9,1.4,7.3},
{9.1,8.5,6.7,4.3,2.1,0.8,0.2,0.2,1.1,2.3,6.1,8.4},
{7.2,9.9,8.4,3.3,1.2,0.8,0.4,0.0,0.6,1.7,4.3,6.2},
{7.6,5.6,3.8,2.8,3.8,0.2,0.0,0.0,0.0,1.3,2.6,5.2}
};
// 使用了 5 個數值列表(花括弧括起來),逗號分隔來初始化二維數組
// 第一個列表初始化第一個元素,依次類推。
- 初始化時也可省略內部的花括弧, 只保留最外面的一對花括弧。
- 如果初始化的數值不夠, 則按照先後順序逐行初始化, 直到用完所有的值。
10.2.2 其他多維數組
- 可以把一維數組想象成一行數據, 把二維數組想象成數據表, 把三維數組想象成一疊數據表。
10.3 指針和數組
數組名是數組首元素的地址
- 在 C 中, 指針加 1 指的是增加一個存儲單元。 對數組而言, 這意味著把加 1 後的地址是下一個元素的地址, 而不是下一個位元組的地址(見圖10.3) 。
- 這是為什麼必須聲明指針所指向對象類型的原因之一。只知道地址不夠, 因為電腦要知道儲存對象需要多少位元組(即使指針指向的是標量變數, 也要知道變數的類型, 否則
*pt
就無法正確地取回地址上的值) 。
-
指針的值是它所指向對象的地址。 地址的表示方式依賴於電腦內部的硬體。 許多電腦(包括PC和Macintosh) 都是按位元組編址, 意思是記憶體中的每個位元組都按順序編號。 這裡, 一個較大對象的地址(如double類型的變數) 通常是該對象第一個位元組的地址。
-
在指針前面使用
*
運算符可以得到該指針所指向對象的值。 -
指針加 1, 指針的值遞增它所指向類型的大小(
sizeof type
以位元組為單位)
dates + 2 == &date[2] // 相同的地址
*(dates + 2) == dates[2] // 相同的值
-
以上關係表明瞭數組和指針的關係十分密切, 可以使用指針標識數組的元素和獲得元素的值。 從本質上看, 同一個對象有兩種表示法。 定義
ar[n]
的意思是*(ar + n)
。 可以認為*(ar + n)
的意思是“到記憶體的ar
位置, 然後移動 n 個單元, 檢索儲存在那裡的值”。 -
不要混淆
*(dates+2)
和*dates+2
。 間接運算符*
的優先順序高於+
, 所以*dates+2
相當於(*dates)+2
明白了數組和指針的關係, 便可在編寫程式時適時使用數組表示法或指針表示法。
指針表示法和數組表示法是兩種等效的方法。編譯器編譯這兩種寫法生成的代碼相同。
10.4 函數、 數組和指針
- 數組名是該數組首元素的地址,所以數組作為函數的參數時,第一個參數是數組名,也就是第一個元素的地址,它是一個指針類型,第二個參數是數組的大小,它是一個整型變數。
第1個形參告訴函數該數組的地址和數據類型, 第2個形參告訴函數該數組中元素的個數
int sum(int* ar, int n);
- 只有在函數原型或函數定義頭中,才可以用
int ar[]
代替int *ar
:int *ar
形式和int ar[]
形式都表示ar
是一個指向int
的指針。 但是,int ar[]
只能用於聲明形式參數。 第 2 種形式int ar[]
提醒讀者指針ar
指向的不僅僅一個int
類型值, 還是一個int
類型數組的元素
int sum (int ar[], int n);
- 下麵 4 中原型是等價的:
int sum(int *ar, int n);
int sum(int *, int);
int sum(int ar[], int n);
int sum(int [], int);
- 我們的系統中用 8 位元組儲存地址, 所以指針變數的大小是 8位元組(其他系統中地址的大小可能不是8位元組) 。
10.4.1 使用指針形參
- 函數要處理數組必須知道何時開始、 何時結束。
還有一種方法是傳遞兩個指針, 第1個指針指明數組的開始處(與前面用法相同) , 第2個指針指明數組的結束處。
int sump(int* start, int* end)
{
int total = 0;
while(start < end)
{
total += *start;// 把數組元素的值加起來
start++;
}
return total;
}
- while迴圈的測試條件是一個不相等的關係, 所以迴圈最後處理的一個元素是end所指向位置的前一個元素。 這意味著end指向的位置實際上在最後一個元素的後一個位置。
// 因為下標從0開始, 所以 marbles + SIZE 指向數組末尾的下一個位置。
answer = sump(marbles, marbles + SIZE);
-
可以把迴圈體壓縮成一行代碼:
total += *start++;
一元運算符*
和++
的優先順序相同, 但結合律是從右往左, 所以start++
先求值, 然後才是*start
。10.4.2 指針表示法和數組表示法
-
處理數組的函數實際上用指針作為參數, 但是在編寫這樣的函數時, 可以選擇是使用數組表示法還是指針表示法。
-
ar[i]
和*(ar+1)
這兩個表達式都是等價的。 無論ar
是數組名還是指針變數, 這兩個表達式都沒問題。 但是, 只有當ar
是指針變數時, 才能使用ar++
這樣的表達式。 -
指針表示法(尤其與遞增運算符一起使用時) 更接近機器語言, 因此一些編譯器在編譯時能生成效率更高的代碼。然而, 許多程式員認為他們的主要任務是確保代碼正確、 邏輯清晰, 而代碼優化應該留給編譯器去做。
10.5 指針操作
指針變數的 9 種基本操作
-
賦值: 可以把地址賦給指針。
-
解引用:
*
運算符給出指針指向地址上儲存的值。 -
取址: 和所有變數一樣, 指針變數也有自己的地址和值。
-
指針與整數相加: 可以使用
+
運算符把指針與整數相加, 或整數與指針相加。如果相加的結果超出了初始指針指向的數組範圍, 計算結果則是未定義的。- 整數都會和指針所指向類型的大小(以位元組為單位)相乘, 然後把結果與初始地址相加。
-
遞增指針: 遞增指向數組元素的指針可以讓該指針移動至數組的下一個元素。
-
指針減去一個整數: 可以使用-運算符從一個指針中減去一個整數。指針必須是第1個運算對象, 整數是第 2 個運算對象。
- 該整數將乘以指針指向類型的大小(以位元組為單位) , 然後用初始地址減去乘積。
-
遞減指針: 當然, 除了遞增指針還可以遞減指針。
-
指針求差: 可以計算兩個指針的差值。 通常, 求差的兩個指針分別指向同一個數組的不同元素, 通過計算求出兩元素之間的距離。 **差值的單位與數組類型的單位相同,如
ptr2 - ptr1
得 2, 意思是這兩個指針所指向的兩個元素相隔兩個int
, 而不是 2 位元組。 -
比較: 使用關係運算符可以比較兩個指針的值, 前提是兩個指針都指向相同類型的對象。
-
在遞增或遞減指針時還要註意一些問題。 編譯器不會檢查指針是否仍指向數組元素。
-
千萬不要解引用未初始化的指針。在使用指針之前, 必須先用已分配的地址初始化它。 例如, 可以用一個現有變數的地址初始化該指針(使用帶指針形參的函數時, 就屬於這種情況) 。或者還可以使用第 12 章將介紹的
malloc()
函數先分配記憶體。
指針的第 1 個基本用法是在函數間傳遞信息。前面學過, 如果希望在被調函數中改變主調函數的變數, 必須使用指針。 指針的第 2 個基本用法是用在處理數組的函數中。