Lippman在《深度探索C++對象模型》的前言中寫道: I have heard a number of people over the years voice opinions similar to those of your colleagues. In every case, those o ...
Lippman在《深度探索C++對象模型》的前言中寫道:
I have heard a number of people over the years voice opinions similar to those of your colleagues. In every case, those opinions could be attributed to a lack of factual knowledge about the C++ language. Just last week I was chatting with an acquaintance who happens to work for an IC testing manufacturer, and he said they don't use C++ because "it does things behind your back." When I pressed him, he said that he understood that C++ calls malloc() and free() without the programmer knowing it. This is of course not true. It is this sort of "myth and legend" that leads to opinions such as those held by your colleagues….
Finding the right balance [between abstraction and pragmatism] requires knowledge, experience, and above all, thought. Using C++ well requires effort, but in my experience the returns on the invested effort can be quite high.
要想C++學得好、用得好,瞭解編譯器在你背後做的事情是很有必要的。
在C++中有一類特殊的類型,聚合類型,可以被看作是純正的數據類型;聚合類型有一個子集,POD類型,C++可以通過POD類型與其他語言交互。C++11定義了標準的記憶體模型,POD的概念被淡化,取而代之的是平凡性與標準佈局。
在介紹這些類型分類之前,我們先來瞭解幾種初始化。
零初始化
零初始化,顧名思義,就是初始化成零。零是指該類型的零,可能不是每一位都是0的表示。
在以下情形中,零初始化被執行:
-
static T object;
-
T();
-
T t = {};
-
T{};
-
CharT array[n] = "";
最後一種指的是字元串字面量長度不足數組長度,剩餘的部分被零初始化。
零初始化和常量初始化與下麵要講的預設初始化和值初始化不在一個層次上,前者是靜態存儲期限對象的行為,後者是初始化器的行為。
預設初始化
當一個對象沒有初始化器時,它被預設初始化,包括以下情形:
-
T object;
; -
new T
; -
沒有包含在構造函數初始化列表的成員對象。
預設初始化的效果是遞歸的:
-
對於類類型,預設構造函數被調用;
-
對於數組類型,每個元素被預設初始化;
-
其他情況,什麼都不做,對象被初始化為非確定值。
依據上面的規則,全局作用域下的int i;
會被預設初始化,i
會擁有非確定值,然而我們又知道,作為一個靜態存儲期限的對象,i
的初始值是0
。事實上,i
先被零初始化,再被預設初始化,第二步中它的0
值保持不變。
合成的預設構造函數對每個對象執行預設初始化,即使是顯式= default
也一樣,類中的非類類型對象的初始值是非確定的,參見C++類成員預設初始值。
訪問一個非確定值的行為是未定義的,儘管那個對象可能只是一個普通整數,但如果較起真來,程式直接崩潰也是符合預期的。沒有什麼理由需要使用一個非確定值,如果需要隨機數可以用專門的隨機數設施。
值初始化
當一個對象的初始化器為空時,它被值初始化,包括以下情形:
-
T()
; -
new T()
; -
Class::Class(...) : member() { ... }
; -
空的列表初始化。
列表初始化包括前三種把()
換成{}
,以及T object{};
,但後者沒有對應的圓括弧版本,因為T object();
是在聲明一個函數。
值初始化的行為是:
-
對於有用戶提供的預設構造函數的類型,執行預設初始化;
-
對於隱式聲明或顯式
= default
預設構造函數的類型,先執行零初始化,再執行預設初始化; -
如果是數組類型,對每個元素值初始化;
-
否則,零初始化。
所謂用戶提供的構造函數,是指有{...}
定義的,= default
和= delete
不在此列。
值初始化的意義在於它可以提供確定的對象。標準庫容器在以容器大小為參數的構造函數中,執行的初始化就是元素類型的值初始化。
聚合類型
聚合類型的概念在C++的發展中有過許多細節調整,這裡先根據C++11標準講解。
聚合類型是數組類型,或滿足以下條件的類類型:
-
沒有
private
或protected
非靜態數據成員; -
沒有用戶提供的構造函數;
-
沒有基類;
-
沒有虛函數;
-
沒有類內初始化。
註意,這個定義不是遞歸的——聚合類型的成員完全可以是非聚合類型。
初始化一個聚合類型的方式有:
-
T object = {arg1, arg2, ...};
; -
T object{arg1, arg2, ...};
。
C++14解禁了類內初始化;C++17允許基類,但不能是private
、protected
或virtual
,相應地構造函數不能有繼承的,還加了一條不能有explicit
的;C++20又把構造函數的要求改回了沒有用戶聲明的構造函數(= default
也不行了)。雖然每次修改都有道理,但是頻繁修改語言核心真心頭疼。至於C99中的指定元素名稱的初始化,也在C++20中才進入標準。
聚合初始化的行為是:
-
所有基類、數組、非靜態數據成員,按照在類中的出現順序與數組下標的順序,從初始化列表中的對應項拷貝初始化;
-
除了列表初始化以外,隱式轉換都是允許的;
-
聚合初始化是遞歸的——如果初始化列表中有嵌套列表,對應項會被列表初始化;
-
不指定長度的數組可以從初始化列表推導長度,非靜態數據成員除外;
-
靜態數據成員與未命名的位域跳過;
-
初始化列表的長度不能超過需要初始化的基類與成員的數量;
-
如果長度不夠,包括初始化列表為空:
-
如果有類內初始化,用它;
-
否則按照列表初始化的規則,對於非類類型和非聚合類類型,值初始化;
-
對於聚合類型,遞歸使用該規則;
-
沒有對應初始化項的成員不能有引用類型的,否則報錯;
-
-
對於聯合體,只有第一個成員被初始化。
學習聚合類型的規則,重在理解聚合初始化的行為——初始化要做的就是、只是拷貝構造每一個成員。這樣就不難解釋一些行為,比如,由於靜態數據成員不是對象的一部分,因此在初始化時被跳過;虛函數和虛基類會引入vptr之類的東西,在初始化列表中沒有體現,因而不被允許。這種思考方式在C++中是很實用的。
POD類型
在C++11以前,POD(Plain Old Data)類型定義為下列類型之一:
-
標量類型,包括算術類型(整數與浮點數)、指針、成員指針、枚舉類型、
std::nullptr_t
(C++11特性,只是為了給標量類型一個完整的定義); -
POD類型的數組類型;
-
類類型,滿足:
-
是聚合類型;
-
沒有非POD的非靜態數據成員;
-
沒有引用類型的成員;
-
沒有用戶提供的拷貝構造函數;
-
沒有用戶提供的析構函數。
-
從C++11起,上述最後一大類修改為:
-
是平凡類型(見下);
-
是標準佈局類型(見下);
-
沒有非POD的非靜態數據成員、
那我們先來看這兩個定義。
平凡
一個平凡(trivial)的類型是這樣的類型:
-
符合TriviallyCopyable要求;
-
有一個或多個預設構造函數,每個都是平凡的(稍後解釋)或刪除的,至少有一個不是刪除的。
對應類型特征(type trait)is_trivial
。
TriviallyCopyable的要求是指:
-
每個拷貝構造函數都是平凡的或刪除的;
-
每個移動構造函數都是平凡的或刪除的;
-
每個拷貝賦值運算符都是平凡的或刪除的;
-
每個移動賦值運算符都是平凡的或刪除的;
-
析構函數是平凡的、非刪除的;
-
TriviallyCopyable類型的數組仍然是TriviallyCopyable的。
這裡有很多平凡,我不打算一一列出其要求,它們大致上講了同一件事:
-
不是用戶提供的;
-
所在類沒有虛擬,包括虛基類和虛函數;
-
對類型中的每個非靜態成員,遞歸該要求。
平凡的構造函數還有一條:沒有類內初始化。
標準佈局
平凡規定了對象控制行為,標準佈局(StandardLayoutType,is_standard_layout
)則規定了對象模型:
-
所有非靜態數據成員都有相同的訪問控制等級,即同為
public
、同為protected
或同為private
(這是因為,編譯器有權把相同訪問等級的成員安排在一起,那樣會破壞佈局); -
沒有虛擬;
-
沒有非靜態數據成員是引用類型;
-
對基類和非靜態數據成員類型遞歸要求StandardLayoutType;
-
不能有同一個基類被繼承兩次,即所謂菱形繼承(
virtual
早就已經否決了); -
繼承鏈中只有一個類型有非靜態數據成員;
-
為了不與空基類優化衝突,基類不能有以下類型:
-
對於非聯合類型,第一個非靜態數據成員的類型;
-
對於聯合類型,所有非靜態成員類型;
-
對於數組類型,其元素類型;
-
以及這些類型遞歸調用這條規則產生的類型,有點計算LL(1)分析演算法中FIRST集的味道。
-
現在可以回到POD類型了。POD是特殊的類型,它有許多非POD類型不具有的性質:
-
完全與C相容,但是仍然可以有成員函數;POD類型標準到甚至可以與其他語言相容;
-
可以用
std::memcpy
拷貝(對於非POD類型,即使滿足TriviallyCopyable,用std::memcpy
拷貝的行為也是未定義的); -
有更長的生命周期,從資源獲取到資源釋放,而非POD類型的是從構造函數結束到析構函數結束;
-
goto
語句不能跳過變數的定義,但POD類型的是允許的; -
POD類型對象的前部沒有填充位元組,即對象指針與第一個成員的指針是相等的。