C/C++文件 C/C++程式文件包括 .h .c .hpp .cpp,其中源文件(.c .cpp)是基本的編譯單元,頭文件(.h .hpp)不會被編譯器編譯。 C/C++項目構建(build)過程,分為以下幾個步驟 預處理 → 編譯 → 鏈接。 預編譯 預編譯的過程可以理解為編譯器(實際上是預處理 ...
C/C++文件
C/C++程式文件包括 .h .c .hpp .cpp,其中源文件(.c .cpp)是基本的編譯單元,頭文件(.h .hpp)不會被編譯器編譯。
C/C++項目構建(build)過程,分為以下幾個步驟 預處理 → 編譯 → 鏈接。
預編譯
預編譯的過程可以理解為編譯器(實際上是預處理器,這裡統稱為編譯器就可以了)在正式編譯之前處理C/C++文件中的預處理命令,即#開頭的代碼。
常用的幾個預處理命令如下:
#include ......
#ifdef ...... #else......#endif
#define ......
#pragma ......
舉個例子,下麵是個很簡單的類定義:
MyClass.h
#define DEFAULT_VALUE 0 class MyClass { public: void Fun(); public: int value = DEFAULT_VALUE; };
MyClass.cpp
#include "MyClass.h" void MyClass::Fun() { // Do someting return; }
預編譯完成後的樣子:
class MyClass { public: void Fun(); public: int value = 0; }; void MyClass::Fun() { // Do someting return; }
可以看到編譯器把.h文件替換到了.cpp文件中的#include 位置上,把DEFAULT_VALUE定義的值也替換到了相應的位置。
編譯
預編譯之後,編譯器會編譯每個源文件(.c .cpp),如果編譯成功,會生成對應的目標文件,Linux為.o文件,Windows平臺下為.obj文件。
以Linux平臺為例,上面的MyClass.cpp編譯完成後會生成MyClass.o文件
使用objdump可以看到目標文件MyClass.o的內容
$$ objdump -x MyClass.o
......
0000000000000000 g F .text 0000000000000015 _ZN7MyClass3FunEv
......
編譯器會把MyClass::Fun()的名字改成_ZN7MyClass3FunEv,這個過程叫Mangle,由於C++支持重載,覆蓋等特性,所以編譯器必須把函數用一個唯一的標識表示。這個字元串就是編譯器生成的唯一標識。
這裡還要單獨說一下頭文件,頭文件的既然不是編譯單元,那麼它的作用是什麼?
頭文件就是負責”聲明“,編譯器在編譯MyClass.cpp的時候,對於MyClass這個類以及Fun()這個成員函數,編譯器必須找到它的聲明,這個函數才能被正確編譯。
如果有其他cpp需要使用MyClass這個類的時候,也需要它的的聲明。例如
main.cpp
#include "MyClass.h" int main(int argc, char** argv) { MyClass tmp; tmp.Fun(); return 0; }
加上#include "MyClass.h" 編譯器在編譯main.cpp的時候才知道怎麼編譯MyClass這個類。MyClass.h里聲明是不會真正被編譯到main.o中,.h文件中的內容在目標文件中只是以列表的形式存在,這個表在後面鏈接時會用到。
當然,頭文件不僅可以用來聲明,還可以定義(定義全局變數,全局函數等),在頭文件中的定義要小心,可能會引起鏈接錯誤。
鏈接
鏈接就是將一堆目標文件加靜態庫文件裝配成可執行文件的過程。(或者是裝配成靜態/動態庫的過程)
上面兩個cpp分別被編譯成了MyClass.o, 和main.o,我們要生成可執行程式的話,就必須經過鏈接的過程,把兩個目標文件合成一個可執行文件。
main.o中,main函數會構造MyClass, 並且調用Fun()函數,那麼main就根據MyClass.h生成的表,找到MyClass.o中的函數,這個就是鏈接器要做的工作。
常見錯誤
構建c/c++工程的時候,最常見的就是兩種錯誤:
-- 編譯錯誤,在編譯過程中產生的錯誤,通常是語法錯誤,沒有聲明,重覆聲明導致編譯目標文件錯誤
其中沒有聲明通常是由於沒有#include相應的頭文件,或者頭文件缺少相應的聲明。
而重覆聲明通常是#include了相同的頭文件,比如 B.h 和 C.h 都包含 A.h,然後 main.h 包含了 B.h 和 C.h,這就導致A.h 在main中被包含了兩次。
解決這個問題的方法是可以在所有.h文件的第一行加上
#pragma once
或者,使用#ifndef ... #define ... #endif 語句塊
#ifndef NEWCLASS_H #define NEWCLASS_H ...... #endif /* NEWCLASS_H */
-- 鏈接錯誤,常見的錯誤也是兩種,沒有定義和重覆定義,和上面的沒有聲明,重覆聲明類似。(這裡定義指的就是函數實現)
- 先討論沒有定義(undefined reference to xxx)
通常是因為函數有聲明,而且被使用了,但是沒有被定義。比如上面MyClass.cpp中,如果Fun()沒有被實現的話,MyClass.cpp和main.cpp編譯時都不會報錯,但是鏈接時會報告找不到Fun()。
當然,如果Fun()沒被main.cpp調用的話,即使不實現它,整個構建過程也不會出錯,因為鏈接器根本不會去找這個函數的定義。
- 然後是重覆定義(multiple definition)
指的一份相同的定義在兩個目標文件中都存在,鏈接的時候鏈接器不知道時用哪個了。這種問題通常由於全局函數,和全局變數定義在了頭文件中。導致多個目標文件包含相同的全局函數和全局變數的定義。
解決方法就是在頭文件中聲明,定義放到cpp文件中,或者為定義加上const 或 static這樣的修飾符,鏈接時會對這些帶有const和修飾符的變數特殊處理的。
const只適用於定義常量變數,static定義的是靜態全局變數,只在當前cpp有效,所以鏈接它也不會被別的目標文件鏈接,就不會有重覆定義的問題了。
總之在頭文件中定義變數和函數要特別主意,可能會導致鏈接錯誤。
當然也不是所有定義都不能放到頭文件中,比如剛纔說的const常量,static全局變數就是例外,還有內聯函數,可以定義在.h文件中,因為內聯函數會被拷貝到每個目標文件中,也不會參與鏈接的過程。
還有模板類必須放在頭文件中定義,這個下麵會討論這個。
關於模板,靜態成員變數
模板類模板函數必須聲明和定義在頭文件中,原因是什麼,舉個例子,假設MyClass是模板類
MyClass.h
template <typename T> class MyClass { public: void Fun(); public: T value; };
MyClass.cpp
#include "MyClass.h" template <typename T> void MyClass<T>::Fun() { // Do someting return; }
main.cpp
int main(int argc, char** argv) { MyClass<int> tmp; tmp.Fun(); return 0; }
編譯的時候沒有問題,但是鏈接時會報錯,main.cpp找不到MyClass<int>::Fun(),如下圖
MyClass雖然定義了Fun函數,但是MyClass.o中存在MyClass<T>::Fun(),而根據MyClass.h文件,main.o中需要找到MyClass<int>::Fun()的定義
結果鏈接器哪都找不到,只好報錯了。(實際上通過objdump查看MyClass.o,編譯器都沒有生成MyClass<T>::Fun(),因為編譯器認為這個函數沒人使用,就直接優化掉了)
如果非得在cpp中定義模板類的成員函數呢,有一種方法就是要顯示的在cpp文件中聲明,比如
MyClass.cpp
#include "MyClass.h" template <typename T> void MyClass<T>::Fun() { // Do someting return; } template void MyClass<int>::Fun();
加上下麵這行就不會有問題了,但是缺點就是開發MyClass的程式員無從知道其他類是怎麼使用這個模板的,不可能把所有可能的模板參數全都一一的列在這裡。
所以模板類的定義還是要寫在.h文件中,
那麼如果main.cpp使用到了MyClass<int>, 另外一個cpp也使用到了MyClass<int>,會不會產生重覆代碼導致重覆定義呢,不會,編譯器會處理好模板類的。
下麵是靜態成員變數,為什麼靜態成員變數的定義要放在cpp里,(模板類的靜態成員變數除外)
靜態成員變數和靜態全局成員變數不同。
靜態成員變數的作用域可以是整個工程,而靜態全局變數的作用域只是當前的cpp。所以靜態成員變數定義在.h中就會發生重定義錯誤。