C++編譯過程 C++ 編譯過程在介紹編譯器之前,先簡單地說一下 C++ 的編譯過程,以便理解編譯器的工作。編譯(compiling)並不意味著只創建僅僅一個可執行文件。創建一個可執行文件是一個多級過程,其中最重要的過程是預處理(preprocessing),編譯(compliation)和鏈接(l ...
C++編譯過程
C++ 編譯過程
在介紹編譯器之前,先簡單地說一下 C++ 的編譯過程,以便理解編譯器的工作。
編譯(compiling)並不意味著只創建僅僅一個可執行文件。創建一個可執行文件是一個多級過程,其中最重要的過程是預處理(preprocessing),編譯(compliation)和鏈接(linking)。從源代碼文件到一個可執行文件的整個過程,最好的說法是 build(中文翻譯的話,有叫生成,有叫編譯鏈接,也有叫構建)。compiling 僅僅是 build 過程的一部分,但你經常會碰到許多人把 compile 指代整個過程。通常情況下,你不需要為這幾個過程運行單獨的命令,編譯器自己會調用,如預處理器。
2.1 預處理
build 過程的第一步就是編譯器運行 C 預處理器,目的是對代碼文件進行文本上的處理。它會處理頭文件包含指令(#include),條件編譯指令(#ifdef……#endif)和巨集(#define),這些指令叫做預處理指令,都以井字元 # 開頭。編譯器本身是絕對看不到這些預處理指令的。
比如:
#include <iostream>
這句代碼會告訴預處理指令,要把 iostream 的文件內容抓去到當前文件,你每包含一個頭文件,它就會把這個頭文件的內容粘貼到這個文件中,然後把 #include 指令移除。
#define MY_NAME "Alex"
巨集就是一個被其它內容(可能比較複雜)替換掉的字元串內容,此時預處理器會把下麵的代碼:
cout << "Hello" << MY_NAME << endl;
展開成:
cout << "Hello" << "Alex" << endl;
由於預處理器在編譯器之前處理代碼,它也可以用來移除代碼——有時,你會要在代碼里執行某些測試代碼。你可以告訴預處理器,如果定義了某個巨集,則包含某些代碼。然後,如果你想執行這個代碼,就定義這個巨集,否則就移除掉這個巨集的定義。
#include <iostream> #define DEBUG using namespace std; int main() { int x; int y; cout << "Enter value for x: "; cin >> x; cout << "Enter value for y: "; cin >> y; x *= y; #ifdef DEBUG cout << "x: " << x << '\n' << "y: "<< y; #endif }
如果你不想執行變數的列印,那麼只需簡單註釋掉 #define DEBUG 就行。
同樣地,你也可以用 #ifndef 來改變條件——如果沒有定義……這個方法通常用在引入多個頭文件的時候。
2.2 編譯
編譯意味著把一個源文件(.cpp)轉變成一個對象文件(object,.o 或 .obj)。
一個對象文件會把你程式里的每一個函數,封裝成一個電腦處理器能理解的形式——機器指令(machine language instructions)。每一個源文件都是單獨編譯過的,即對象文件包含的機器代碼都是編譯過的源代碼。比如,你有三個源文件,經過編譯,生成了三個對象文件,每一個對象文件都包含了各自對應的機器代碼。
但你還不能運行它們,這時候,就需要鏈接器了。
2.3 鏈接
鏈接(Linking),是把一堆對象文件和庫(有時也可能僅僅是一個對象文件,但也需要鏈接)創建成一個單獨的可執行文件(比如 .exe 或 .dll)。
鏈接器通過一種適當的格式創建一個可執行的文件,並傳遞每個獨立的對象文件內容到一個可執行的結果。鏈接器也處理含有對象文件源代碼之外的其它函數的引用,比如 C++ 標準庫里的函數。當你調用了一個 C++ 標準庫的函數,如 cout << “Hi”,你就在使用一個自己代碼中沒有定義的函數,它被定義在一個相關的對象文件中,但這是由編譯器提供的,並不屬於你。在編譯時,編譯器知道這個函數是有效的,因為你引出了 iostream 頭文件,但由於這個函數不是 cpp 文件的一部分,編譯器就會在調用樹(call tree)留下一個存根(stub),鏈接器會遍歷對象文件,針對每一個存根,它會找到正確的函數地址,然後從已鏈接過的其它對象文件中,用正確的地址替換掉對應的存根。
這個過程有時也叫做修正(fixup)。當你把你的程式分離成多個源文件時,你就會利用鏈接器來修正所有在源文件中調用過的函數。如果鏈接器找不到這個函數的位置,它就會生成一個 undefined function error,即便代碼被編譯器通過了,也不意味著代碼是正確的。鏈接器是首先以全局的視角來探測這種錯誤的。