## 文章首發 [【重學C++】01| C++ 如何進行記憶體資源管理?](https://mp.weixin.qq.com/s/ZhRhN07wjypnkWXcu_Lz3g) ## 前言 大家好,我是只講技術乾貨的會玩code,今天是【重學C++】的第一講,我們來學習下C++的記憶體管理。 與java ...
文章首發
前言
大家好,我是只講技術乾貨的會玩code,今天是【重學C++】的第一講,我們來學習下C++的記憶體管理。
與java、golang等自帶垃圾回收機制的語言不同,C++並不會自動回收記憶體。我們必須手動管理堆上記憶體分配和釋放,這往往會導致記憶體泄漏和記憶體溢出等問題。而且,這些問題可能不會立即出現,而是運行一段時間後,才會暴露出現,排查也很困難。因此,瞭解和掌握C++中的記憶體管理技巧和工具是非常重要的,可以提高程式性能、減少錯誤和增加安全性。
記憶體分區
在C++中,將操作系統分配給程式的記憶體空間按照用途劃分了代碼段、數據段、棧、堆幾個不同的區域,每個區域都有其獨特的記憶體管理機制。
代碼區
代碼區是用於存儲程式代碼的區域,代碼段在程式真正執行前就被載入到記憶體中,在程式執行期間,代碼區記憶體不會被修改和釋放。
由於代碼區是只讀的,所以會被多個進程共用。在多個進程同時執行同一個程式時,操作系統只需要將代碼段載入到記憶體中一次,然後讓多個進程共用這個記憶體區域即可。
數據段
數據段用於存儲靜態全局變數、靜態局部變數和靜態常量等靜態數據。在程式運行期間,數據段的大小固定不變,但其內容可以被修改。按照變數是否被初始化。數據段可分為已初始化數據段和未初始化數據段。
棧
C++中函數調用以及函數內的局部變數的使用,都是通過棧這個記憶體分區實現的。棧分區由操作系統自動分配和釋放,是一種"後進先出"的一種記憶體分區。每個棧的大小是固定的,一般只有幾MB,所以如果棧變數太大,或者函數調用嵌套太深,容易發生棧溢出(stack overflow)。
先來一段示例代碼,看看C++是如何使用棧進行使用棧來進行函數調用的。
#include <iostream>
void inner(int a) {
std::cout << a << std::endl;
}
void outer(int n) {
int a = n + 1;
inner(a);
}
int main() {
outer(4);
}
上面這段代碼運行過程中的棧變化如下圖
每當程式調用一個函數時,該函數的參數、局部變數和返回地址等信息會被壓入棧中。當函數執行完畢,再將這些信息從棧中彈出。根據之前壓入的外層調用者壓入棧的返回地址,返回到外層調用者未執行的代碼繼續執行。
本地變數是直接存儲在棧上的,當函數執行完成後,這些變數占用的記憶體就會被釋放掉了。前面例子中的本地變數是簡單類型,在C++中稱為POD類型。對於帶有構造和析構函數的非POD類型變數,棧上的記憶體分配同樣有效。編譯器會在合適的時機,插入對構造函數和析構函數的調用。
這裡有個問題,當函數執行發生異常時,析構函數還會被調用嗎?
答案是會的,C++對於發生異常時對析構函數的調用稱為"棧展開"。通過下麵這段代碼演示棧展開。
#include <iostream>
#include <string>
class Obj {
public:
std::string name_;
Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};
~Obj() {std::cout << "~Obj() " << name_ << std::endl;};
};
void bar() {
auto o = Obj{"bar"};
throw "bar exception";
}
int main() {
try {
bar();
} catch (const char* e) {
std::cout << "catch Exception: " << e << std::endl;
}
}
執行代碼的結果是:
Obj() bar
~Obj() bar
catch Exception: bar exception
可以發現,發生異常時,bar
函數中的本地變數o
還是能被正常析構。
棧展開的過程實際上是異常發生時,匹配catch子句的過程。
- 程式拋出異常,停止當前執行的調用鏈,開始尋找與異常匹配的catch子句。
- 如果異常發生在try中,則會首先檢查與該try塊匹配的catch子句。如果異常所在函數體沒有try捕獲異常。則會直接進入下一步。
- 如果第二步未找到匹配的catch,則會在外層的try塊中查找,直到找到為止。
- 如果到了最外層還沒有找到匹配的catch,也就是說異常得不到處理,程式會調用標準庫函數terminate終止函數的執行。
在這期間,棧上所有的對象都會被自動析構。
堆
堆是C++中用來存儲動態分配記憶體的記憶體分區,堆記憶體的分配和釋放需要手動管理,可以通過new/delete或malloc/free等函數進行分配和釋放。堆記憶體的大小通常是不固定的,當我們需要動態分配記憶體時,就可以使用堆記憶體。
堆記憶體由程式員手動分配和釋放,因此使用堆記憶體需要註意記憶體泄漏和記憶體溢出等問題。當程式員忘記釋放已分配的記憶體時,會導致記憶體泄漏問題。而當申請的堆記憶體超過了操作系統所分配給進程的記憶體限制時,會導致記憶體溢出問題。
C++程式絕大多數的記憶體泄露,都是由於忘記調用delete/free來釋放堆上的資源。
還是上代碼
#include <iostream>
#include <string>
class Obj {
public:
std::string name_;
Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};
~Obj() {std::cout << "~Obj() " << name_ << std::endl;};
};
Obj* makeObj() {
Obj* obj = nullptr;
try {
obj = new Obj{"makeObj"};
...
} catch(...) {
delete obj;
throw;
}
return obj;
}
Obj* foo() {
Obj* obj = nullptr;
try {
obj = makeObj();
...
} catch(...) {
delete obj;
}
return obj;
}
int main() {
Obj* obj = foo();
...
delete obj;
}
可以看到,由makeObj
函數創建的堆變數obj
, 在每個獲取該變數的上層調用中,都需要關心對該變數的處理。這無疑極大得增加了開發者的心智負擔。
RAII
想在堆上創建對象,又不想處理這麼複雜的記憶體釋放操作。C++沒有像java、golang其他語言創建一套垃圾回收機制,而是採用了一種特有的資源管理方式 --- RAII(Resource Acquisition Is Initialization,資源獲取即初始化)。
RAII利用棧對象在作用域結束後會自動調用析構函數的特點,通過創建棧對象來管理資源。在棧對象構造函數中獲取資源,在棧對象析構函數中負責釋放資源,以此保證資源的獲取和釋放。
下麵給出一個通過RAII來自動釋放堆記憶體的例子
#include <iostream>
class AutoIntPtr {
public:
AutoIntPtr(int* p = nullptr) : ptr(p) {}
~AutoIntPtr() { delete ptr; }
int& operator*() const { return *ptr; }
int* operator->() const { return ptr; }
private:
int* ptr;
};
void foo() {
AutoIntPtr p(new int(5));
std::cout << *p << std::endl; // 5
}
int main() {
foo();
}
上面例子中,AutoIntPtr
類封裝了一個動態分配的int
類型的指針,它的構造函數用於獲取資源(ptr = p),析構函數用於釋放資源(delete ptr)。當AutoIntPtr
超出作用域時,自動調用析構函數來釋放所包含的資源。
基於RAII,C++11引入了std::unique_ptr
和std::shared_ptr
等智能指針用於記憶體管理類,使得記憶體管理變得更加方便和安全。這些記憶體管理類可以自動進行記憶體釋放,避免了手動釋放記憶體的繁瑣工作。值得一提的是,上面的AutoIntPtr
就是一個簡化版的智能指針了。
在實際開發中,RAII的應用很廣。不僅僅用於自動釋放記憶體。還可以用來關閉文件、釋放資料庫連接、釋放同步鎖等。
總結
本文介紹了C++中的記憶體管理機制,包括記憶體分區、棧、堆和RAII技術等內容。通過學習本文,我們可以更好地掌握C++的記憶體管理技巧,避免記憶體泄漏和記憶體溢出等問題。