C++的核心理念之一是RAII,Resource Acquisition Is Initialization,資源獲取即初始化。資源有很多種,記憶體、互斥鎖、文件、套接字等;RAII可以用來實現一種與作用域綁定的資源管理方法(如 );這些都不在本文的討論範圍之內。 記憶體是一種資源。從字面上來看,“資源 ...
C++的核心理念之一是RAII,Resource Acquisition Is Initialization,資源獲取即初始化。資源有很多種,記憶體、互斥鎖、文件、套接字等;RAII可以用來實現一種與作用域綁定的資源管理方法(如std::lock_guard
);這些都不在本文的討論範圍之內。
記憶體是一種資源。從字面上來看,“資源獲取”是指在棧或堆上開闢空間,“初始化”是指調用構造函數,“即”的意思是兩者是綁定起來的。對應地,資源銷毀即釋放。這種機制保證了任何函數訪問參數對象時不會訪問到非法地址,除了構造和析構函數以外的任何函數的參數都不會是未初始化的。
然而,C++作為能夠面向底層的語言,允許我們把記憶體獲取與初始化分開來:std::malloc
和std::free
用於分配和釋放記憶體,定位new
表達式和析構函數的顯式調用用於初始化和銷毀對象。
malloc與free
std::malloc
用於分配記憶體,std::free
用於釋放記憶體,兩者都定義在<cstdlib>
中:
void* malloc(std::size_t size);
void free(void* ptr);
比如,我想要分配一個int
的動態記憶體,就應該給size
填上sizeof(int)
,返回值就是指向那個int
的指針。如果是數組,就給size
乘上元素個數。註意在C++中,從void*
到T*
的轉換不能是隱式的。
要回收它,把指針傳給free
,不需要size
:
#include <iostream>
#include <cstdlib>
int main()
{
auto p = static_cast<int*>(std::malloc(sizeof(int) * 10));
p[0] = 1;
p[1] = 2;
std::cout << p[0] << ' ' << p[1] << std::endl;
std::free(p);
}
如果std::malloc
過程中發生了錯誤,比如記憶體不足,std::malloc
會返回NULL
,nullptr
的前身。實際使用時都應該考慮這種情況。
std::malloc
得到的記憶體必須用free
釋放。std::malloc
/std::free
的記憶體分配與new
/delete
不互通。
定位new表達式
std::malloc
分配的記憶體是未經初始化的,對於int
等內置類型可以直接使用,而類類型則未必,需要先初始化才能使用。
我們知道,類的非靜態成員函數都有一個隱式的this
指針作為參數,構造函數也不例外,在未初始化的記憶體上構造對象,就是把這塊記憶體的指針作為this
傳入構造函數。不幸的是,沒有顯式調用構造函數這種語法:
auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
ptr->A("hello"); // error
(在MSVC中,ptr->A::A("hello");
是合法的,但這是非標準的。)
我們需要定位new
,它定義在<new>
中,需要#include
以後才能使用:
void* operator new(std::size_t, void*);
new
運算符是可以重載的,new
運算符的功能是為new
表達式中的構造函數提供this
指針。但是定位new
不行,它總是忠實地返回它的第二個參數。
定位new
表達式有以下形式:
new (ptr) Type;
new (ptr) Type(args);
new (ptr) Type[size];
new (ptr) Type[size]{list};
ptr
為要當作this
的指針,Type
為要構造的類型,args
為可能為空的參數列表,size
為數組大小(可以動態),list
為數組元素列表。
利用定位new
,把ptr
作為this
的構造函數可以這樣調用:
#include <iostream>
#include <cstdlib>
#include <string>
#include <utility>
class A
{
public:
A(std::string s) : string(std::move(s))
{
std::cout << "A::A(std::string)" << std::endl;
}
std::string& get()
{
return string;
}
private:
std::string string;
};
int main()
{
auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
// std::cout << ptr->get() << std::endl; // disaster
// ptr->A("hello"); // error
new (ptr) A("hello");
std::cout << ptr->get() << std::endl;
// delete ptr; // disaster
// what's next?
}
不要因為ptr
簡單就不加括弧,括弧不是為了什麼運算符優先順序,而是定位new
表達式的一部分。
剛纔不是說std::malloc
與new
不互通嗎?怎麼在std::malloc
來的ptr
上用定位new
了呢?因為定位new
根本不插手記憶體分配,和std::malloc
是兩回事。
定位new
不止可以用於std::malloc
來的動態記憶體,甚至可以是局部變數:
char buffer[sizeof(A)];
auto ptr = new (buffer) A("hello");
std::cout << ptr->get() << std::endl;
與常規的new
一樣,定位new
表達式也返回一個指針,就是Type*
類型的ptr
。
顯式調用析構函數
上面通過std::malloc
得到的ptr
,為什麼不能直接std::free
呢?因為std::string
裡面的資源還沒釋放,正確的做法是調用A
的析構函數。
不能對一個對象調用構造函數,那麼析構函數呢?答案是肯定的。只是~
在形式上有點怪,尤其是當你把模板參數T
換成int
後得到ptr->~int()
時,後者直接寫是不合法的。
所以對於上面的ptr
,要這樣才能釋放所有資源:
ptr->~A();
std::free(ptr);
顯式調用析構函數,就像在幫編譯器做事情一樣。編譯器會不會領情呢?寫個代碼測試一下吧:
#include <iostream>
#include <string>
#include <utility>
class A
{
public:
A(std::string s) : string(std::move(s))
{
std::cout << "A::A(std::string)" << std::endl;
}
std::string& get()
{
std::cout << "A::get()" << std::endl;
return string;
}
~A()
{
std::cout << "A::~A()" << std::endl;
}
private:
std::string string;
};
int main()
{
{
A a("");
a.~A();
}
std::cout << "I'm OK" << std::endl;
}
程式輸出:
A::A(std::string)
A::~A()
A::~A()
I'm OK
看來編譯器並不領情,即使我們調用了析構函數,變數離開作用域時還會再調用一次。儘管在MSVC和GCC中,I'm OK
都成功輸出了,std::string
都挺住了錯誤的析構,但是這個程式的行為仍然是未定義的。
因此,定位new
語句與析構函數的顯式調用必須配對。