在 C/C++ 中,聯合體(Union)是一種構造數據類型。在一個聯合體內,我們可以定義多個不同類型的成員,這些成員將會共用同一塊記憶體空間。老版本的 C++ 為了和C語言保持相容,對聯合體的數據成員的類型進行了很大程度的限制,這些限制在今天看來並沒有必要,因此 C++11 取消了這些限制。 C++1 ...
在 C/C++ 中,聯合體(Union)是一種構造數據類型。在一個聯合體內,我們可以定義多個不同類型的成員,這些成員將會共用同一塊記憶體空間。老版本的 C++ 為了和C語言保持相容,對聯合體的數據成員的類型進行了很大程度的限制,這些限制在今天看來並沒有必要,因此 C++11 取消了這些限制。
C++11 標準規定,任何非引用類型都可以成為聯合體的數據成員,這種聯合體也被稱為非受限聯合體。例如:
class Student{
public:
Student(bool g, int a): gender(g), age(a) {}
private:
bool gender;
int age;
};
union T{
Student s; // 含有非POD類型的成員,gcc-5.1.0 版本報錯
char name[10];
};
int main(){
return 0;
}
上面的代碼中,因為 Student 類帶有自定義的構造函數,所以是一個非 POD 類型的,這導致編譯器報錯。這種規定只是 C++ 為了相容C語言而制定,然而在長期的編程實踐中發現,這種規定是沒有必要的。
1. C++11 允許非 POD 類型
C++98 不允許聯合體的成員是非 POD 類型,但是 C++11 取消了這種限制。
POD 是 C++ 中一個比較重要的概念,POD 是英文 Plain Old Data 的縮寫,用來描述一個類型的屬性。POD 類型一般具有以下幾種特征(包括 class、union 和 struct等):
-
沒有用戶自定義的構造函數、析構函數、拷貝構造函數和移動構造函數。
-
不能包含虛函數和虛基類。
-
非靜態成員必須聲明為 public。
-
類中的第一個非靜態成員的類型與其基類不同,例如:
class B1{};
class B2 : B1 { B1 b; };
class B2 的第一個非靜態成員 b 是基類類型,所以它不是 POD 類型。
- 在類或者結構體繼承時,滿足以下兩種情況之一:
- 派生類中有非靜態成員,且只有一個僅包含靜態成員的基類;
- 基類有非靜態成員,而派生類沒有非靜態成員。
比如下麵的例子:
class B1 { static int n; };
class B2 : B1 { int n1; };
class B3 : B2 { static int n2; };
對於 B2,派生類 B2 中有非靜態成員,且只有一個僅包含靜態成員的基類 B1,所以它是 POD 類型。對於 B3,基類 B2 有非靜態成員,而派生類 B3 沒有非靜態成員,所以它也是 POD 類型。
-
所有非靜態數據成員均和其基類也符合上述規則(遞歸定義),也就是說 POD 類型不能包含非 POD 類型的數據。
-
此外,所有相容C語言的數據類型都是 POD 類型(struct、union 等不能違背上述規則)。
2. C++11 允許聯合體有靜態成員
C++11 刪除了聯合體不允許擁有靜態成員的限制。例如:
union U {
static int func() {
int n = 3;
return n;
}
};
需要註意的是,靜態成員變數只能在聯合體內定義,卻不能在聯合體外使用,這使得該規則很沒用。
3. 非受限聯合體的賦值註意事項
C++11 規定,如果非受限聯合體內有一個非 POD 的成員,而該成員擁有自定義的構造函數,那麼這個非受限聯合體的預設構造函數將被編譯器刪除;其他的特殊成員函數,例如預設拷貝構造函數、拷貝賦值操作符以及析構函數等,也將被刪除。這條規則可能導致對象構造失敗,比如下麵的例子:
#include <string>
using namespace std;
union U {
string s;
int n;
};
int main() {
U u; // 構造失敗,因為 U 的構造函數被刪除
return 0;
}
在上面的例子中,因為 string 類擁有自定義的構造函數,所以 U 的構造函數被刪除;定義 U 的類型變數 u 需要調用預設構造函數,所以 u 也就無法定義成功。
解決上面問題的一般需要用到 placement new,代碼如下:
#include <string>
using namespace std;
union U {
string s;
int n;
public:
U() { new(&s) string; }
~U() { s.~string(); }
};
int main() {
U u;
return 0;
}
構造時,採用 placement new 將 s 構造在其地址 &s 上,這裡 placement new 的唯一作用只是調用了一下 string 類的構造函數。註意,在析構時還需要調用 string 類的析構函數。
placement new 是什麼?
placement new 是 new 關鍵字的一種進階用法,既可以在棧(stack)上生成對象,也可以在堆(heap)上生成對象。相對應地,我們把常見的 new 的用法稱為 operator new,它只能在 heap 上生成對象。placement new 的語法格式如下:
new(address) ClassConstruct(...)
address 表示已有記憶體的地址,該記憶體可以在棧上,也可以在堆上;ClassConstruct(...) 表示調用類的構造函數,如果構造函數沒有參數,也可以省略括弧。placement new 利用已經申請好的記憶體來生成對象,它不再為對象分配新的記憶體,而是將對象數據放在 address 指定的記憶體中。在本例中,placement new 使用的是 s 的記憶體空間。
4. 非受限聯合體的匿名聲明和“枚舉式類”
匿名聯合體是指不具名的聯合體(也即沒有名字的聯合體),一般定義如下:
union U{
union { int x; }; //此聯合體為匿名聯合體
};
可以看到,聯合體 U 內定義了一個不具名的聯合體,該聯合體包含一個 int 類型的成員變數,我們稱這個聯合體為匿名聯合體。
同樣的,非受限聯合體也可以匿名,而當非受限的匿名聯合體運用於類的聲明時,這樣的類被稱為“枚舉式類”。示例如下:
#include <cstring>
using namespace std;
class Student{
public:
Student(bool g, int a): gender(g), age(a){}
bool gender;
int age;
};
class Singer {
public:
enum Type { STUDENT, NATIVE, FOREIGENR };
Singer(bool g, int a) : s(g, a) { t = STUDENT; }
Singer(int i) : id(i) { t = NATIVE; }
Singer(const char* n, int s) {
int size = (s > 9) ? 9 : s;
memcpy(name , n, size);
name[s] = '\0';
t = FOREIGENR;
}
~Singer(){}
private:
Type t;
union {
Student s;
int id;
char name[10];
};
};
int main() {
Singer(true, 13);
Singer(310217);
Singer("J Michael", 9);
return 0;
}
上面的代碼中使用了一個匿名非受限聯合體,它作為類 Singer 的“變長成員”來使用,這樣的變長成員給類的編寫帶來了更大的靈活性,這是 C++98 標準中無法達到的(編譯器會報member 'Student Singer::<anonymous union>::s' with constructor not allowed in union
錯誤)。