本文介紹了記憶體管理的基礎知識,重點分析了棧區與堆區的區別,並詳細討論了V8引擎的記憶體管理機制,包括垃圾回收策略和優化技術。文章通過實例代碼展示了堆區和棧區的記憶體變化,並探討了v8如何通過並行、增量和併發技術優化垃圾回收性能。 ...
記憶體管理簡介
記憶體管理是控制和協調軟體應用程式訪問電腦記憶體的方式的過程。
當一個程式運行在某個操作系統上時,進程需要擁有對RAM的訪問許可權,以實現:
- 載入程式需要執行的位元組碼;
- 存儲正在執行的程式所使用的數據值和數據結構;
- 載入程式執行所需的任何運行時系統。
一個進程在啟動時,會向操作系統申請記憶體空間。一個進程的記憶體空間被分為多個區域,其中最主要的兩個區分別是棧區和堆區。
棧區
棧區的記憶體分配符合棧先進後出這一特性,並且棧區的大小通常是固定的。
- 與堆區不同,棧區的變數查詢比較簡單,且通常只在棧頂進行數據的存儲和讀取,只需要維護一個棧指針即可,讀寫操作非常快;
- 存儲在棧中的數據必須在編譯時確定其大小,並且在運行時不會動態變化;
- 在進程中每調用一個函數,就會推入一個棧幀(stack frame)。每一個棧幀都記錄著函數執行所需要的數據。例如,當一個函數聲明瞭一個新變數時,變數會被添加到棧頂的棧幀中,當函數執行完畢返回時,棧幀會被清除,內部所有變數也都會被清除;
- 多線程進程的每一個線程擁有各自的調用棧;
- 棧區的記憶體管理由操作系統負責;
- 常見的存儲於棧區的數據有:局部變數、指針、函數幀;
- 棧區常見的異常是“棧溢出異常”(stack overflow error),這是因為棧區相比於堆區要小很多。
堆區
堆區用於動態地分配記憶體,程式需要通過指針在堆區中查找數據。
- 堆區與棧區相比可以存儲更多數據,但是查詢數據比較慢;
- 堆區用於存儲動態大小的數據;
- 多線程進程的多個線程共用一個堆區;
- 常見的存儲於堆區的數據有:全局變數,對象、字元串等引用類型;
為什麼需要關註記憶體管理
記憶體的容量有限,如果程式不加節制地使用記憶體而不釋放,最終會導致記憶體耗盡,可能導致程式或操作系統崩潰。因此,編程語言通常提供自動記憶體管理的機制,以避免這種情況發生。
在討論記憶體管理時,我們通常指的是如何管理堆記憶體。
-
這是因為棧記憶體的管理由操作系統自動完成,通常只要避免遞歸調用導致棧溢出,就不會出錯;
-
而堆記憶體需要程式員手動管理分配與釋放,雖然自由度更好,但也帶來了更大的風險與複雜度。
記憶體管理方法
-
手動記憶體管理
開發者需要自行分配和釋放對象的記憶體。例如,C 和 C++ 提供了
malloc
、realloc
、calloc
和free
函數來管理記憶體,開發者必須在程式中分配和釋放堆記憶體,並有效地使用指針來管理記憶體。 -
垃圾回收(GC)
垃圾回收是現代語言中最常見的記憶體管理方式之一,通常在某些時間間隔運行,因此可能會產生稱為“暫停時間”的輕微開銷。JVM(Java/Scala/Groovy/Kotlin)、JavaScript、C#、Golang、OCaml 和 Ruby 預設使用垃圾回收進行記憶體管理。
-
標記 - 清除演算法
這通常是一個兩階段的演算法,首先標記仍然被引用的對象為“存活”,然後在下一階段釋放未存活對象的記憶體。
-
引用計數演算法
每個對象都會有一個引用計數,當對它的引用發生變化時,該計數會增加或減少,當計數變為零時,就會進行垃圾回收。由於無法處理迴圈引用,這種方法很少被使用。
-
V8 引擎中的記憶體管理
V8 引擎被 NodeJS、Deno、Electron 等運行時以及 Chrome、Chromium、Brave、Opera 和 Microsoft Edge 等瀏覽器使用。
由於 JavaScript 是一種解釋性語言,它需要一個引擎來解釋和執行代碼。V8 引擎負責解釋 JavaScript 並將其編譯為原生機器碼。
V8 是用 C++ 編寫的,可以嵌入到任何 C++ 應用程式中。
V8記憶體結構
JavaScript 是單線程的,V8 引擎為每個 JavaScript 上下文生成一個進程;如果使用了工作線程(service workers),則 V8 引擎會為每個工作線程生成一個新的進程。