在c++中,當一個類含有虛函數的時候,類就具有了多態性。構造函數的一項重要功能就是初始化vptr指針,這是保證多態性的關鍵步驟。 構造函數初始化vptr指針 下麵是c++源碼: class X { private: int i; public: X(int ii) { i = ii; } virtu ...
在c++中,當一個類含有虛函數的時候,類就具有了多態性。構造函數的一項重要功能就是初始化vptr指針,這是保證多態性的關鍵步驟。
構造函數初始化vptr指針
下麵是c++源碼:
class X { private: int i; public: X(int ii) { i = ii; } virtual void set(int ii) {//虛函數 i = ii; } }; int main() { X x(1); }
下麵是對應的main函數彙編碼:
_main PROC ; 16 : int main() { push ebp mov ebp, esp sub esp, 8;為對象x預留8byte空間 vptr指針占4位元組 成員變數i占4byte ; 17 : X x(1); push 1;//將1壓棧,作為參數傳遞給構造函數 lea ecx, DWORD PTR _x$[ebp];//獲取x的首地址,即this指針,作為隱含參數傳遞給構造器 call ??0X@@QAE@H@Z ; 為x調用構造器 ; 18 : } xor eax, eax mov esp, ebp pop ebp ret 0 _main ENDP
從彙編碼可以看到,由於類X具有虛函數,main函數在棧上為對象x預留了8byte的空間,用來存放vptr指針和成員變數i。
下麵是x的構造函數的彙編碼:
??0X@@QAE@H@Z PROC ; X::X, COMDAT ; _this$ = ecx ; 5 : X(int ii) { push ebp mov ebp, esp push ecx;壓棧ecx的目的是為了給this指針(x對象首地址)預留4byte的空間 mov DWORD PTR _this$[ebp], ecx;將this指針存儲到剛纔預留的空間里 ecx裡面存放了x的首地址 mov eax, DWORD PTR _this$[ebp];將x的首地址給寄存器eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;將??_7X@@6B@的偏移地址(即vtable的首地址)放到x對象的首地址指向的記憶體儲 這裡就是初始化vptr指針 ; 6 : i = ii; mov ecx, DWORD PTR _this$[ebp];將x首地址給ecx mov edx, DWORD PTR _ii$[ebp];將參數ii的值給寄存器edx mov DWORD PTR [ecx+4], edx;將寄存器eax的值寫入偏移x首地址4byte處的記憶體,即給x的成員變數i賦值 ; 7 : } mov eax, DWORD PTR _this$[ebp];將x對象首地址給寄存器eax,作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 4 ??0X@@QAE@H@Z ENDP
從代碼中可以看出來,編譯器確實暗中插入了代碼,來用vtable的首地址初始化vptr指針,並且vptr指針位於對象首地址處。
如果類有繼承關係,構造函數又如何初始化vptr指針呢?
下麵是c++源碼:
class X { private: int i; public: virtual void f() {} }; class Y : public X {//Y繼承自X private: int j; }; int main() { Y y; }
下麵是main函數中的彙編碼:
_main PROC ; 16 : int main() { push ebp mov ebp, esp sub esp, 12 ; 為對象y預留12 byte的空間 vptr指針4byte 父類成員變數4byte 子類成員變數4byte ; 17 : Y y; lea ecx, DWORD PTR _y$[ebp];獲取對象y的首地址(即this指針),作為隱含參數傳遞給構造函數 call ??0Y@@QAE@XZ;調用y的構造函數 雖然y沒有顯示定義構造函數,但由於其含有虛成員函數,編譯器提供預設構造函數 ; 18 : } xor eax, eax mov esp, ebp pop ebp ret 0 _main ENDP
下麵是子類構造函數彙編碼:
??0Y@@QAE@XZ PROC ; Y::Y, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;//壓棧ecx的目的是存放this指針 mov DWORD PTR _this$[ebp], ecx;將this指針(即對象首地址)放到剛纔預留空間 ecx裡面存放對象首地址 mov ecx, DWORD PTR _this$[ebp];將對象首地址給ecx 作為隱含參數傳遞給父類構造函數 call ??0X@@QAE@XZ;調用父類構造函數 mov eax, DWORD PTR _this$[ebp];將y的首地址給寄存器eax mov DWORD PTR [eax], OFFSET ??_7Y@@6B@;將y的vtable(??_7Y@@6B@)首地址賦給y對象首地址所指記憶體 即初始化子類vptr指針 mov eax, DWORD PTR _this$[ebp];將y首地址給eax,作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0Y@@QAE@XZ ENDP
下麵是父類構造函數彙編碼:
??0X@@QAE@XZ PROC ; X::X, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;壓棧的目的是為了存放this指針(父對象對象首地址)預留空間 mov DWORD PTR _this$[ebp], ecx;將父對象對象首地址(ecx中保存)放入剛纔預留空間 mov eax, DWORD PTR _this$[ebp];將父對象首地址給寄存器eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;將vtable(??_7X@@6B@ 和子類不同)首地址賦給父對象首地址處的記憶體 即初始化父對象的vptr指針 mov eax, DWORD PTR _this$[ebp];將父對象的首地址傳給eax,作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0X@@QAE@XZ ENDP
從上面子類和父類的構造函數彙編碼可以看出來,子對象包含父對象,在構造子對象的時候先構造父對象(子對象構造函數先調用父對象構造函數)。而且父對象的首地址和子對象的首地址一樣(通過彙編碼中ecx傳遞的值可以看出來),因此父對象和子對象的vptr指針位於同一處。所以,在構造對象的構成中,vptr指針先被初始化指向父對象的vtable首地址(在父對象構造函數中),最後又被初始化為指向子對象的vtable首地址(在子對象的構造函數中)。因此,在涉及繼承的時候,vptr指針的值由最後調用的構造函數決定。
在構造函數調用虛函數機制失效,也就是說,在構造函數中調用虛函數總是本地版本(析構函數中也是一樣)
c++源碼如下:
class X { private: int i; public: virtual void f(int ii) { i = ii; } X() { f(1); } }; class Y : public X {//Y繼承自X private: int j; public: virtual void f(int ii) { j = ii; } Y() { f(2); } }; int main() { Y y; }
下麵主要來看父類X和子類Y中的構造函數的彙編碼:
子類Y的構造函數彙編碼:
??0Y@@QAE@XZ PROC ; Y::Y, COMDAT ; _this$ = ecx ; 20 : Y() { push ebp mov ebp, esp push ecx;壓棧的目的是為存放this指針(在ecx寄存器裡面存放了子對象首地址)預留空間 mov DWORD PTR _this$[ebp], ecx;將子對象首地址存入剛纔預留空間 mov ecx, DWORD PTR _this$[ebp];將子類首地址作為隱含參數傳給父對象構造器(子對象首地址和父對象首地址一樣) call ??0X@@QAE@XZ ; 調用父類構造器 mov eax, DWORD PTR _this$[ebp];將子對象首地址傳給寄存器eax mov DWORD PTR [eax], OFFSET ??_7Y@@6B@;將子對象的vtable首地址存到子對象首地址所指向的記憶體,即初始化子對象的vptr指針 ; 21 : f(2); push 2;將2壓棧,作為參數調用函數f,這裡,子對象調用的是自己的函數f mov ecx, DWORD PTR _this$[ebp];將子對象首地址傳給ecx,作為隱含參數傳遞給成員函數f call ?f@Y@@UAEXH@Z ; 調用子對象中的f函數 ; 22 : } mov eax, DWORD PTR _this$[ebp];將子對象首地址給寄存器eax,作為返回值。構造器總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0Y@@QAE@XZ ENDP ; Y::Y
父類X構造函數的彙編碼:
??0X@@QAE@XZ PROC ; X::X, COMDAT ; _this$ = ecx ; 8 : X() { push ebp mov ebp, esp push ecx;壓棧的目的是存放父對象首地址預留空間 父對象首地址和子對象首地址一樣 mov DWORD PTR _this$[ebp], ecx;ecx裡面存放父對象首地址,傳給剛纔預留的空間 mov eax, DWORD PTR _this$[ebp];將父對象首地址傳給eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;將父對象的vtable首地址寫入父對象首地址所指向的記憶體 即初始化父對象的vptr指針 ; 9 : f(1); push 1;將1壓棧,作為參數調用函數f 這裡調用時父對象的版本 mov ecx, DWORD PTR _this$[ebp];將父對象首地址作為隱含參數傳給f call ?f@X@@UAEXH@Z ; 調用函數f ; 10 : } mov eax, DWORD PTR _this$[ebp];將父對象首地址傳給eax作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0X@@QAE@XZ ENDP
從彙編碼中可以看到,構造函數中確實不存在虛機制,都只調用本地版本的函數
析構函數
析構函數在執行的時候,會先將vptr指針初始化為當前類的虛表vtable首地址,但是如果析構函數時編譯器提供非無用的預設析構函數,則不會有vptr指針的初始化操作:
c++源碼:
class X { private: int i; public: virtual void set(int ii) { i = ii; } ~X() {} }; class Y : public X { private: int i; }; int main() { Y y; }
類Y析構函數彙編碼:
??1Y@@QAE@XZ PROC ; Y::~Y, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;為傳進來的y對象首地址預留空間 mov DWORD PTR _this$[ebp], ecx;ecx中保存y對象首地址,存到剛纔空間中 mov ecx, DWORD PTR _this$[ebp];將y對象首地址(y對象包含父對象,他們的首地址一樣)傳給ecx,作為隱含參數傳地址類X的析構函數 call ??1X@@QAE@XZ ; 調用類X的析構函數 mov esp, ebp pop ebp ret 0 ??1Y@@QAE@XZ ENDP
從彙編碼可以看到,編譯器為y對象提供了非無用的預設析構函數,用來調用父類的析構函數,但是在y對象的析構函數裡面,並沒有初始化y對象vptr指針指向類Y的虛表vtable的操作。
下麵是類X的析構函數彙編碼:
??1X@@QAE@XZ PROC ; X::~X, COMDAT ; _this$ = ecx ; 9 : ~X() {} push ebp mov ebp, esp push ecx;為傳進來的父對象的首地址預留空間 mov DWORD PTR _this$[ebp], ecx;為將傳進來的父對象首地址存放到剛纔空間 mov eax, DWORD PTR _this$[ebp];父對象首地址給eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;將父類vtable首地址給父對象首地址處的記憶體 即初始化父對象中的vptr指針 mov esp, ebp pop ebp ret 0 ??1X@@QAE@XZ ENDP
父類的析構函數有初始化vptr的操作,此時的vptr所指向的虛表已經是類X所對應的虛表,而不是子類Y對應的虛表。
抽象基類
c++源碼如下:
class X { private: int i; public: virtual void f() = 0;//純虛函數 X() { i = 1; } }; class Y : public X {//Y繼承自X private: int j; public: virtual void f() { j = 2; } }; int main() { Y y; }
只看父類X的構造函數和子類Y的構造函數的彙編碼:
子類Y構造函數的彙編碼:
??0Y@@QAE@XZ PROC ; Y::Y, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;為保存子對象首地址預留空間 mov DWORD PTR _this$[ebp], ecx;將ecx(裡面存放子對象首地址)的值放到剛纔的空間 mov ecx, DWORD PTR _this$[ebp];將子對象首地址傳給ecx,作為隱含參數(this指針)調用父對象的構造函數 call ??0X@@QAE@XZ ; 調用父對象的構造函數 mov eax, DWORD PTR _this$[ebp];將子對象首地址給eax t mov DWORD PTR [eax], OFFSET ??_7Y@@6B@;將子對象的vtable首地址存到子對象首地址所指向的記憶體,即初始化子對象的vptr mov eax, DWORD PTR _this$[ebp];將子對象的首地址給eax,作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0Y@@QAE@XZ ENDP
父類X構造函數彙編碼:
??0X@@QAE@XZ PROC ; X::X, COMDAT ; _this$ = ecx ; 6 : X() { push ebp mov ebp, esp push ecx;壓棧的目的就是為存儲父對象首地址(即this指針)預留空間 mov DWORD PTR _this$[ebp], ecx;將父對象首地址存到剛纔的空間 mov eax, DWORD PTR _this$[ebp];將父對象的首地址傳給eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;將父對象的vtable(由於父類為抽象類,其vtable不完全,即裡面沒有存放純虛函數的地址,只為其保留了一個位置)首地址存到父對象首地址所指的記憶體 即初始化父對象的vptr指針 ; 7 : i = 1; mov ecx, DWORD PTR _this$[ebp];將父對象的首地址給ecx mov DWORD PTR [ecx+4], 1;將1存到偏移父對象首地址4byte處,即給父對象的成員變數i賦值 ; 8 : } mov eax, DWORD PTR _this$[ebp];父對象的首地址給eax 作為返回值。構造函數總是返回對象首地址 mov esp, ebp pop ebp ret 0 ??0X@@QAE@XZ ENDP
從彙編碼可以看出,在構造子類的過程中,依然調用了父類的構造函數,儘管父類是一個抽象類。但這隻是為了初始化子對象中包含父對象的部分,如果直接想從父類實例化一個對象,編譯器報錯,這是因為父類的vtable不完全,編譯器不能安全的創建一個抽象類對象。而在構造子對象的構成當中,雖然在構造子對象中所包含的的父對象部分,vptr暫時指向了父類的vtable,但是,當子對象構造完成時,vptr最終指向了子類的vtable。子類的vtable是一個完整的,因此編譯器允許。
多態的晚捆綁機制只有在用地址或者引用調用虛函數的時候才有效,如果用對象本身直接調用虛函數,則不會出現晚捆綁,而是直接調用。
c++源碼:
class X { private: int i; public: virtual void f() { i = 1; } }; class Y : public X {//Y繼承自X private: int j; public: virtual void f() { j = 2; } }; int main() { Y y;//棧上創建對象 Y* yp = new Y;//堆上創建對象 y.f();//用對象直接調用 yp->f();//用指針間接調用 }
class X { private: int i; public: virtual void f() { i = 1; } }; class Y : public X {//Y繼承自X private: int j; public: virtual void f() { j = 2; } }; int main() { Y y;//棧上創建對象 Y* yp = new Y;//堆上創建對象 y.f();//用對象直接調用 yp->f();//用指針間接調用 }
主要來看用對象直接調用函數f和用指針調用函數f的彙編碼:
用對象直接調用函數f的彙編碼:
; 25 : y.f(); lea ecx, DWORD PTR _y$[ebp];將棧上創建的對象y的首地址給ecx,作為隱含參數傳遞給f call ?f@Y@@UAEXXZ ; 用絕對地址調用f
用指針間接調用函數f的彙編碼:
; 26 : yp->f(); mov ecx, DWORD PTR _yp$[ebp];將yp指針指向的堆對象的首地址給ecx mov edx, DWORD PTR [ecx];將堆上創建的對象首地址所指向的內容給edx 即將vptr指針指向的vtable首地址給edx mov ecx, DWORD PTR _yp$[ebp];將yp指針指向的堆對象的首地址給ecx 作為隱含參數傳遞給要調用的函數f mov eax, DWORD PTR [edx];edx存的是vtable首地址,這裡取vtable首地址的內容給eax 即函數f的地址給eax call eax;調用eax
從彙編碼中可以看出,用對象直接調用的時候根本沒有訪問虛表vtable,只有用指針調用的時候才會訪問vtable,形成晚捆綁。因為用對象直接調用的時候,編譯器已經知道了對象的確切類型,為了提高效率,當調用這些虛函數的時候,使用了造捆綁。
繼承和vtable
當子類繼承父類時,編譯器為子類重新創建一個vtable,並且父類中的虛函數在父類vatelbe中的位置準確的映射到子類vtable中的同樣位置,對於子類中重新定義的虛函數,將在子類vtable的新位置插入其地址。
下麵是c++源碼:
class X { private: int i; public: virtual void a() { i = 1; } virtual void b() { i = 2; } }; class Y : public X { private: int i; public: virtual void c() {//新定義的虛函數 i = 3; } void b() {//重寫父類中的虛函數 i = 4; } }; int main() { X* xp = new X; X* yp = new Y; xp->a(); xp->b(); yp->a(); yp->b(); //yp->c();編譯器報錯 }
可以看到,用yp指針調用子類中的虛函數c,編譯器報錯。這是因為儘管yp指針所指向的時機類型是子類Y,但是由於向上轉型為基類X類型,因此,編譯器在編譯的時候只針對基類,而基類只有虛函數a,b,所以不允許調用子類中的虛函數c。
下麵只給出調用虛函數時的彙編代碼:
; 28 : xp->a(); mov edx, DWORD PTR _xp$[ebp];將xp所指向的堆對象首地址給edx mov eax, DWORD PTR [edx];將堆對象首地址裡面的內容給eax,即將vptr指向的vtable首地址給eax mov ecx, DWORD PTR _xp$[ebp];將xp所指向的堆對象首地址給ecx,作為隱含參數傳遞給即將調用的虛成員函數 mov edx, DWORD PTR [eax];將vtable首地址裡面的內容給edx,即將虛函數a的地址給edx(這裡,虛函數a的地址位於父類X的vtable首地址處) call edx;調用虛成員函數a ; 29 : xp->b(); mov eax, DWORD PTR _xp$[ebp];將xp所指堆對象的首地址給eax mov edx, DWORD PTR [eax];將堆對象首地址的內容給edx,即將vptr指向的vtable首地址給edx mov ecx, DWORD PTR _xp$[ebp];將xp所指堆對象的首地址給ecx mov eax, DWORD PTR [edx+4];將偏移vtable首地址4byte處記憶體內容給eax,即將虛函數b的地址給eax(這裡,虛函數b的地址位於偏移父類X的vtable首地址4byte處) call eax;調用虛成員函數b ; 30 : yp->a(); mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx mov edx, DWORD PTR [ecx];將堆對象首地址的內容給edx,即將子類vptr指向的vtable首地址給edx mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx,作為隱含參數傳遞給虛成員函數a mov eax, DWORD PTR [edx];將子類vtable首地址處的內容給eax,即將虛函數a的地址給eax(這裡,虛函數a的地址同樣位於子類Y的vtable首地址處) call eax;調用虛成員函數a ; 31 : yp->b(); mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx mov edx, DWORD PTR [ecx];將堆對象首地址的內容給edx,即將子類vptr指向的vtable首地址給edx mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx,作為隱含參數傳遞給虛成員函數b mov eax, DWORD PTR [edx+4];將偏移子類vtable首地址4byte處記憶體的內容給eax,即將虛函數b的地址給eax(這裡,虛函數b的地址同樣位於偏移子類Y的vtable首地址4byte處) call eax;調用虛成員函數b ; 32 : //yp->c();
從彙編碼可以看出,a,b虛函數在子類vtable和父類table中的位置是一樣的(從它們相對於自己所在vtable的偏移量可以看出)。這就保證了不論對象實際的類型是什麼,編譯器總能使用同樣的偏移量來調用虛函數。假如不這麼做,也就是說虛函數a,b在子類Y的vtable中的位置和在父類X的vtable中的位置不一樣,由於向上轉型,編譯器只針對父類工作,也就是對虛函數a,b的調用只會根據父類X的vtable來確定偏移量,那麼在實際運行的時候就會出錯,實際的子對象根本調用不到正確的函數,多態失效。
在上面的例子中,如果將yp轉為實際的類型調用c,我們會看到編譯器形成的偏移量為8byte,彙編代碼如下:
; 32 : yp->c(); mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx mov edx, DWORD PTR [ecx];將堆對象首地址的內容給edx,即將子類vptr指向的vtable首地址給edx mov ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx,作為隱含參數傳遞給虛成員函數c mov eax, DWORD PTR [edx+8];將偏移子類vtable首地址8byte處記憶體的內容給eax,即將虛函數c的地址給eax(這裡,虛函數b的地址同樣位於偏移子類Y的vtable首地址