從彙編看c++中的多態_ZenDei技術網路在線

在c++中，當一個類含有虛函數的時候，類就具有了多態性。構造函數的一項重要功能就是初始化vptr指針，這是保證多態性的關鍵步驟。構造函數初始化vptr指針下麵是c++源碼: class X { private: int i; public: X(int ii) { i = ii; } virtu ...

在c++中，當一個類含有虛函數的時候，類就具有了多態性。構造函數的一項重要功能就是初始化vptr指針，這是保證多態性的關鍵步驟。

構造函數初始化vptr指針

下麵是c++源碼:

class X {
private:
    int i;
public:
    X(int ii) {
        i = ii;
    }
    virtual void set(int ii) {//虛函數
        i = ii;
    }
};




int main() {
   X x(1);
}

下麵是對應的main函數彙編碼:

_main    PROC

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 8;為對象x預留8byte空間 vptr指針占4位元組 成員變數i占4byte

; 17   :    X x(1);

    push    1;//將1壓棧，作為參數傳遞給構造函數
    lea    ecx, DWORD PTR _x$[ebp];//獲取x的首地址，即this指針，作為隱含參數傳遞給構造器
    call    ??0X@@QAE@H@Z                ; 為x調用構造器

; 18   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

從彙編碼可以看到，由於類X具有虛函數，main函數在棧上為對象x預留了8byte的空間，用來存放vptr指針和成員變數i。

下麵是x的構造函數的彙編碼:

??0X@@QAE@H@Z PROC                    ; X::X, COMDAT
; _this$ = ecx

; 5    :     X(int ii) {

    push    ebp
    mov    ebp, esp
    push    ecx;壓棧ecx的目的是為了給this指針(x對象首地址)預留4byte的空間
    mov    DWORD PTR _this$[ebp], ecx;將this指針存儲到剛纔預留的空間里 ecx裡面存放了x的首地址
    mov    eax, DWORD PTR _this$[ebp];將x的首地址給寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;將??_7X@@6B@的偏移地址(即vtable的首地址)放到x對象的首地址指向的記憶體儲 這裡就是初始化vptr指針

; 6    :         i = ii;

    mov    ecx, DWORD PTR _this$[ebp];將x首地址給ecx
    mov    edx, DWORD PTR _ii$[ebp];將參數ii的值給寄存器edx
    mov    DWORD PTR [ecx+4], edx;將寄存器eax的值寫入偏移x首地址4byte處的記憶體，即給x的成員變數i賦值

; 7    :     }

    mov    eax, DWORD PTR _this$[ebp];將x對象首地址給寄存器eax，作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@H@Z ENDP

從代碼中可以看出來，編譯器確實暗中插入了代碼，來用vtable的首地址初始化vptr指針，並且vptr指針位於對象首地址處。

如果類有繼承關係，構造函數又如何初始化vptr指針呢？

下麵是c++源碼:

class X {
private:
    int i;
public:
    virtual void f() {}
};

class Y : public X {//Y繼承自X
private:
   int j;
};




int main() {
 Y y;
}

下麵是main函數中的彙編碼:

_main    PROC

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 為對象y預留12 byte的空間 vptr指針4byte 父類成員變數4byte 子類成員變數4byte

; 17   :  Y y;

    lea    ecx, DWORD PTR _y$[ebp];獲取對象y的首地址(即this指針),作為隱含參數傳遞給構造函數
    call    ??0Y@@QAE@XZ;調用y的構造函數 雖然y沒有顯示定義構造函數，但由於其含有虛成員函數，編譯器提供預設構造函數

; 18   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

下麵是子類構造函數彙編碼:

??0Y@@QAE@XZ PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;//壓棧ecx的目的是存放this指針
    mov    DWORD PTR _this$[ebp], ecx;將this指針(即對象首地址)放到剛纔預留空間 ecx裡面存放對象首地址
    mov    ecx, DWORD PTR _this$[ebp];將對象首地址給ecx 作為隱含參數傳遞給父類構造函數
    call    ??0X@@QAE@XZ;調用父類構造函數
    mov    eax, DWORD PTR _this$[ebp];將y的首地址給寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_7Y@@6B@;將y的vtable(??_7Y@@6B@)首地址賦給y對象首地址所指記憶體 即初始化子類vptr指針
    mov    eax, DWORD PTR _this$[ebp];將y首地址給eax，作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0Y@@QAE@XZ ENDP

下麵是父類構造函數彙編碼:

??0X@@QAE@XZ PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;壓棧的目的是為了存放this指針(父對象對象首地址)預留空間
    mov    DWORD PTR _this$[ebp], ecx;將父對象對象首地址(ecx中保存)放入剛纔預留空間
    mov    eax, DWORD PTR _this$[ebp];將父對象首地址給寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;將vtable(??_7X@@6B@ 和子類不同)首地址賦給父對象首地址處的記憶體 即初始化父對象的vptr指針
    mov    eax, DWORD PTR _this$[ebp];將父對象的首地址傳給eax，作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0X@@QAE@XZ ENDP

從上面子類和父類的構造函數彙編碼可以看出來，子對象包含父對象，在構造子對象的時候先構造父對象(子對象構造函數先調用父對象構造函數)。而且父對象的首地址和子對象的首地址一樣(通過彙編碼中ecx傳遞的值可以看出來)，因此父對象和子對象的vptr指針位於同一處。所以，在構造對象的構成中，vptr指針先被初始化指向父對象的vtable首地址(在父對象構造函數中)，最後又被初始化為指向子對象的vtable首地址(在子對象的構造函數中)。因此，在涉及繼承的時候，vptr指針的值由最後調用的構造函數決定。

在構造函數調用虛函數機制失效，也就是說，在構造函數中調用虛函數總是本地版本(析構函數中也是一樣)

c++源碼如下:

class X {
private:
    int i;
public:
    virtual void f(int ii) {
        i = ii;
    }
    X() {
       f(1);
    }
};

class Y : public X {//Y繼承自X
private:
   int j;
public:
    virtual void f(int ii) {
        j = ii;
    }
    Y() {
        f(2);
    }
};




int main() {
 Y y;
}

下麵主要來看父類X和子類Y中的構造函數的彙編碼:

子類Y的構造函數彙編碼:

??0Y@@QAE@XZ PROC                    ; Y::Y, COMDAT
; _this$ = ecx

; 20   :     Y() {

    push    ebp
    mov    ebp, esp
    push    ecx;壓棧的目的是為存放this指針(在ecx寄存器裡面存放了子對象首地址)預留空間
    mov    DWORD PTR _this$[ebp], ecx;將子對象首地址存入剛纔預留空間
    mov    ecx, DWORD PTR _this$[ebp];將子類首地址作為隱含參數傳給父對象構造器(子對象首地址和父對象首地址一樣)
    call    ??0X@@QAE@XZ                ; 調用父類構造器
    mov    eax, DWORD PTR _this$[ebp];將子對象首地址傳給寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_7Y@@6B@;將子對象的vtable首地址存到子對象首地址所指向的記憶體，即初始化子對象的vptr指針

; 21   :         f(2);

    push    2;將2壓棧，作為參數調用函數f，這裡，子對象調用的是自己的函數f
    mov    ecx, DWORD PTR _this$[ebp];將子對象首地址傳給ecx，作為隱含參數傳遞給成員函數f
    call    ?f@Y@@UAEXH@Z                ; 調用子對象中的f函數

; 22   :     }

    mov    eax, DWORD PTR _this$[ebp];將子對象首地址給寄存器eax，作為返回值。構造器總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0Y@@QAE@XZ ENDP                    ; Y::Y

父類X構造函數的彙編碼:

??0X@@QAE@XZ PROC                    ; X::X, COMDAT
; _this$ = ecx

; 8    :     X() {

    push    ebp
    mov    ebp, esp
    push    ecx;壓棧的目的是存放父對象首地址預留空間 父對象首地址和子對象首地址一樣
    mov    DWORD PTR _this$[ebp], ecx;ecx裡面存放父對象首地址，傳給剛纔預留的空間
    mov    eax, DWORD PTR _this$[ebp];將父對象首地址傳給eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;將父對象的vtable首地址寫入父對象首地址所指向的記憶體 即初始化父對象的vptr指針

; 9    :        f(1);

    push    1;將1壓棧，作為參數調用函數f 這裡調用時父對象的版本
    mov    ecx, DWORD PTR _this$[ebp];將父對象首地址作為隱含參數傳給f
    call    ?f@X@@UAEXH@Z                ; 調用函數f

; 10   :     }

    mov    eax, DWORD PTR _this$[ebp];將父對象首地址傳給eax作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0X@@QAE@XZ ENDP

從彙編碼中可以看到，構造函數中確實不存在虛機制，都只調用本地版本的函數

析構函數

析構函數在執行的時候，會先將vptr指針初始化為當前類的虛表vtable首地址，但是如果析構函數時編譯器提供非無用的預設析構函數，則不會有vptr指針的初始化操作:

c++源碼:

class X {
private:
    int i;
public:
    virtual void set(int ii) {
        i = ii;
    }
    ~X() {}
};
class Y : public X {
private:
    int i;
};
int main() {
    Y y;
}

類Y析構函數彙編碼:

??1Y@@QAE@XZ PROC                    ; Y::~Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;為傳進來的y對象首地址預留空間
    mov    DWORD PTR _this$[ebp], ecx;ecx中保存y對象首地址，存到剛纔空間中
    mov    ecx, DWORD PTR _this$[ebp];將y對象首地址(y對象包含父對象，他們的首地址一樣)傳給ecx，作為隱含參數傳地址類X的析構函數
    call    ??1X@@QAE@XZ                ; 調用類X的析構函數
    mov    esp, ebp
    pop    ebp
    ret    0
??1Y@@QAE@XZ ENDP

從彙編碼可以看到，編譯器為y對象提供了非無用的預設析構函數，用來調用父類的析構函數，但是在y對象的析構函數裡面，並沒有初始化y對象vptr指針指向類Y的虛表vtable的操作。

下麵是類X的析構函數彙編碼:

??1X@@QAE@XZ PROC                    ; X::~X, COMDAT
; _this$ = ecx

; 9    :     ~X() {}

    push    ebp
    mov    ebp, esp
    push    ecx;為傳進來的父對象的首地址預留空間
    mov    DWORD PTR _this$[ebp], ecx;為將傳進來的父對象首地址存放到剛纔空間
    mov    eax, DWORD PTR _this$[ebp];父對象首地址給eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;將父類vtable首地址給父對象首地址處的記憶體 即初始化父對象中的vptr指針
    mov    esp, ebp
    pop    ebp
    ret    0
??1X@@QAE@XZ ENDP

父類的析構函數有初始化vptr的操作，此時的vptr所指向的虛表已經是類X所對應的虛表，而不是子類Y對應的虛表。

抽象基類

c++源碼如下:

class X {
private:
    int i;
public:
    virtual void f() = 0;//純虛函數
    X() {
       i = 1;
    }
};

class Y : public X {//Y繼承自X
private:
   int j;
public:
    virtual void f() {
        j = 2;
    }
};




int main() {
 Y y;
}

只看父類X的構造函數和子類Y的構造函數的彙編碼:
子類Y構造函數的彙編碼:

??0Y@@QAE@XZ PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;為保存子對象首地址預留空間 
    mov    DWORD PTR _this$[ebp], ecx;將ecx(裡面存放子對象首地址)的值放到剛纔的空間
    mov    ecx, DWORD PTR _this$[ebp];將子對象首地址傳給ecx，作為隱含參數(this指針)調用父對象的構造函數
    call    ??0X@@QAE@XZ                ; 調用父對象的構造函數
    mov    eax, DWORD PTR _this$[ebp];將子對象首地址給eax t
    mov    DWORD PTR [eax], OFFSET ??_7Y@@6B@;將子對象的vtable首地址存到子對象首地址所指向的記憶體，即初始化子對象的vptr
    mov    eax, DWORD PTR _this$[ebp];將子對象的首地址給eax，作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0Y@@QAE@XZ ENDP

父類X構造函數彙編碼:

??0X@@QAE@XZ PROC                    ; X::X, COMDAT
; _this$ = ecx

; 6    :     X() {

    push    ebp
    mov    ebp, esp
    push    ecx;壓棧的目的就是為存儲父對象首地址(即this指針)預留空間
    mov    DWORD PTR _this$[ebp], ecx;將父對象首地址存到剛纔的空間
    mov    eax, DWORD PTR _this$[ebp];將父對象的首地址傳給eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;將父對象的vtable(由於父類為抽象類，其vtable不完全，即裡面沒有存放純虛函數的地址，只為其保留了一個位置)首地址存到父對象首地址所指的記憶體 即初始化父對象的vptr指針

; 7    :        i = 1;

    mov    ecx, DWORD PTR _this$[ebp];將父對象的首地址給ecx
    mov    DWORD PTR [ecx+4], 1;將1存到偏移父對象首地址4byte處，即給父對象的成員變數i賦值

; 8    :     }

    mov    eax, DWORD PTR _this$[ebp];父對象的首地址給eax 作為返回值。構造函數總是返回對象首地址
    mov    esp, ebp
    pop    ebp
    ret    0
??0X@@QAE@XZ ENDP

從彙編碼可以看出，在構造子類的過程中，依然調用了父類的構造函數，儘管父類是一個抽象類。但這隻是為了初始化子對象中包含父對象的部分，如果直接想從父類實例化一個對象，編譯器報錯，這是因為父類的vtable不完全，編譯器不能安全的創建一個抽象類對象。而在構造子對象的構成當中，雖然在構造子對象中所包含的的父對象部分，vptr暫時指向了父類的vtable，但是，當子對象構造完成時，vptr最終指向了子類的vtable。子類的vtable是一個完整的，因此編譯器允許。

多態的晚捆綁機制只有在用地址或者引用調用虛函數的時候才有效，如果用對象本身直接調用虛函數，則不會出現晚捆綁，而是直接調用。

c++源碼:

class X {
private:
    int i;
public:
    virtual void f() {
        i = 1;
    }
};

class Y : public X {//Y繼承自X
private:
   int j;
public:
    virtual void f() {
        j = 2;
    }
};




int main() {
 Y y;//棧上創建對象
 Y* yp = new Y;//堆上創建對象
 y.f();//用對象直接調用
 yp->f();//用指針間接調用
}

class X {
private:
    int i;
public:
    virtual void f() {
        i = 1;
    }
};

class Y : public X {//Y繼承自X
private:
   int j;
public:
    virtual void f() {
        j = 2;
    }
};




int main() {
 Y y;//棧上創建對象
 Y* yp = new Y;//堆上創建對象
 y.f();//用對象直接調用
 yp->f();//用指針間接調用
}

主要來看用對象直接調用函數f和用指針調用函數f的彙編碼:

用對象直接調用函數f的彙編碼:

; 25   :  y.f();

    lea    ecx, DWORD PTR _y$[ebp];將棧上創建的對象y的首地址給ecx，作為隱含參數傳遞給f
    call    ?f@Y@@UAEXXZ                ; 用絕對地址調用f

用指針間接調用函數f的彙編碼:

; 26   :  yp->f();

    mov    ecx, DWORD PTR _yp$[ebp];將yp指針指向的堆對象的首地址給ecx
    mov    edx, DWORD PTR [ecx];將堆上創建的對象首地址所指向的內容給edx 即將vptr指針指向的vtable首地址給edx
    mov    ecx, DWORD PTR _yp$[ebp];將yp指針指向的堆對象的首地址給ecx 作為隱含參數傳遞給要調用的函數f
    mov    eax, DWORD PTR [edx];edx存的是vtable首地址，這裡取vtable首地址的內容給eax 即函數f的地址給eax
    call    eax;調用eax

從彙編碼中可以看出，用對象直接調用的時候根本沒有訪問虛表vtable，只有用指針調用的時候才會訪問vtable，形成晚捆綁。因為用對象直接調用的時候，編譯器已經知道了對象的確切類型，為了提高效率，當調用這些虛函數的時候，使用了造捆綁。

繼承和vtable

當子類繼承父類時，編譯器為子類重新創建一個vtable，並且父類中的虛函數在父類vatelbe中的位置準確的映射到子類vtable中的同樣位置，對於子類中重新定義的虛函數，將在子類vtable的新位置插入其地址。

下麵是c++源碼:

class X {
private:
    int i;
public:
    virtual void a() {
        i = 1;
    }
    virtual void b() {
        i = 2;
    }
};

class Y : public X {
private:
    int i;
public:
    virtual void c() {//新定義的虛函數
        i = 3;
    }
    void b() {//重寫父類中的虛函數
        i = 4;
    }
};

int main() {
    X* xp = new X;
    X* yp = new Y;
    xp->a();
    xp->b();
    yp->a();
    yp->b();
    //yp->c();編譯器報錯
}

可以看到，用yp指針調用子類中的虛函數c，編譯器報錯。這是因為儘管yp指針所指向的時機類型是子類Y，但是由於向上轉型為基類X類型，因此，編譯器在編譯的時候只針對基類，而基類只有虛函數a，b，所以不允許調用子類中的虛函數c。

下麵只給出調用虛函數時的彙編代碼:

; 28   :     xp->a();

    mov    edx, DWORD PTR _xp$[ebp];將xp所指向的堆對象首地址給edx
    mov    eax, DWORD PTR [edx];將堆對象首地址裡面的內容給eax，即將vptr指向的vtable首地址給eax
    mov    ecx, DWORD PTR _xp$[ebp];將xp所指向的堆對象首地址給ecx，作為隱含參數傳遞給即將調用的虛成員函數
    mov    edx, DWORD PTR [eax];將vtable首地址裡面的內容給edx，即將虛函數a的地址給edx(這裡，虛函數a的地址位於父類X的vtable首地址處)
    call    edx;調用虛成員函數a

; 29   :     xp->b();

    mov    eax, DWORD PTR _xp$[ebp];將xp所指堆對象的首地址給eax
    mov    edx, DWORD PTR [eax];將堆對象首地址的內容給edx，即將vptr指向的vtable首地址給edx
    mov    ecx, DWORD PTR _xp$[ebp];將xp所指堆對象的首地址給ecx
    mov    eax, DWORD PTR [edx+4];將偏移vtable首地址4byte處記憶體內容給eax，即將虛函數b的地址給eax(這裡，虛函數b的地址位於偏移父類X的vtable首地址4byte處)
    call    eax;調用虛成員函數b

; 30   :     yp->a();

    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx
    mov    edx, DWORD PTR [ecx];將堆對象首地址的內容給edx，即將子類vptr指向的vtable首地址給edx
    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx，作為隱含參數傳遞給虛成員函數a
    mov    eax, DWORD PTR [edx];將子類vtable首地址處的內容給eax，即將虛函數a的地址給eax(這裡，虛函數a的地址同樣位於子類Y的vtable首地址處)
    call    eax;調用虛成員函數a

; 31   :     yp->b();

    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx
    mov    edx, DWORD PTR [ecx];將堆對象首地址的內容給edx，即將子類vptr指向的vtable首地址給edx
    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx，作為隱含參數傳遞給虛成員函數b
    mov    eax, DWORD PTR [edx+4];將偏移子類vtable首地址4byte處記憶體的內容給eax，即將虛函數b的地址給eax(這裡，虛函數b的地址同樣位於偏移子類Y的vtable首地址4byte處)
    call    eax;調用虛成員函數b
; 32   :     //yp->c();

從彙編碼可以看出，a，b虛函數在子類vtable和父類table中的位置是一樣的(從它們相對於自己所在vtable的偏移量可以看出)。這就保證了不論對象實際的類型是什麼，編譯器總能使用同樣的偏移量來調用虛函數。假如不這麼做，也就是說虛函數a，b在子類Y的vtable中的位置和在父類X的vtable中的位置不一樣，由於向上轉型，編譯器只針對父類工作，也就是對虛函數a，b的調用只會根據父類X的vtable來確定偏移量，那麼在實際運行的時候就會出錯，實際的子對象根本調用不到正確的函數，多態失效。

在上面的例子中，如果將yp轉為實際的類型調用c，我們會看到編譯器形成的偏移量為8byte，彙編代碼如下:

; 32   :     yp->c();

    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象的首地址給ecx
    mov    edx, DWORD PTR [ecx];將堆對象首地址的內容給edx，即將子類vptr指向的vtable首地址給edx
    mov    ecx, DWORD PTR _yp$[ebp];將yp所指向的堆對象首地址給ecx，作為隱含參數傳遞給虛成員函數c
    mov    eax, DWORD PTR [edx+8];將偏移子類vtable首地址8byte處記憶體的內容給eax，即將虛函數c的地址給eax(這裡，虛函數b的地址同樣位於偏移子類Y的vtable首地址