1.重定位 在完成空間與地址的分配步驟之後,鏈接器就進入了符號解析與重定位的步驟,這也就是靜態鏈接的核心作用; 在分析符號解析和重定位之前,首先讓我們來看看“a.o”裡面是怎麼使用這兩個外部符號,也就是說我們在“a.c”源程式裡面使用了“shared”變數和“swap”函數,那麼編譯器在將“a.c” ...
1.重定位
在完成空間與地址的分配步驟之後,鏈接器就進入了符號解析與重定位的步驟,這也就是靜態鏈接的核心作用;
在分析符號解析和重定位之前,首先讓我們來看看“a.o”裡面是怎麼使用這兩個外部符號,也就是說我們在“a.c”源程式裡面使用了“shared”變數和“swap”函數,那麼編譯器在將“a.c”編譯成指令時,它如何訪問“shared”變數?如何調用“swap”函數?
使用objdump的-d參數可以看到“a.o”的代碼反彙編結果:
objdump -d a.o
我們知道在程式的代碼裡面使用的都是虛擬地址,在這裡也可以看到“main”的起始地址以0x00000000開始,等到空間分配完成之後,各個函數才回確定自己在虛擬地址空間中的位置;
我們可以很清楚地看見“a.o”的反彙編結果中,“a.o”共定義了函數main,這個函數占用了0x33個位元組,共17條指令;最左邊的那列是每條指令的偏移量,每一行代表一條指令(有些指令的長度很長,如偏移0x18的mov指令,它的二進位顯示占據了兩行)。我們已經用粗體標出了兩個引用“shared”和“swap”的位置,對於“shared”的引用是一條“mov”指令,這條指令總共8個位元組,它的作用是將“shared”的地址賦值給ESP寄存器+4的偏移地址中去,前面4個位元組是指令碼,,後面4個位元組是“shared”的地址,我們只關心後面的4個位元組部分,如圖4-4:
當源代碼“a.c”在被編譯成目標文件時,編譯器並不知道“shared”和“swap”的地址,因為它們定義在其他目標文件中,所以編譯器就暫時把地址0看成“shared”的地址,我們可以看到這條“mov”指令中,關於“shared”的地址部分為“0x00000000”。
另一個偏移是0x26的指令的一條調用,它其實就是表示對swap函數的調用,如4-5所示:
這條指令共5個位元組,前面的0xE8是操作碼(intel從IA-32手冊可以查閱到),這條指令是一條近址相對位移調用指令(Call near),後面的4個位元組就是被調用函數的相對於調用指令的下一條指令的偏移量。在沒有重定位之前,相對偏移被置為0xFFFFFFFC(小端),它是常量“-4”的補碼形式。
讓我們來仔細看看這條指令的含義。緊跟在這條call指令後面的那條指令為add指令,add指令的實際調用地址為0x27。我們可以看到0x27存放著並不是swap函數的地址,跟前面的“shared” 一樣,“0xFFFFFFFC”只是一個臨時的假地址,因為在編譯的時候,編譯器並不知道“swap”的真正地址。
編譯器把這兩條指令的地址部分暫時用地址“0x00000000”和“0xfffffffc”代替著,把真正的地址計算工作留給了鏈接器。我們通過前面的空間和 地址分配可以得知,鏈接器在完成地址和空間分配之後就已經確定了所有符號的虛擬地址了,那麼鏈接器就可以根據符號的地址對每個須要重定位的指令進行地位修正。我們用objdump來反彙編輸出程式“ab”的代碼段,可以看到main函數的兩個重定位入口都已經被修正到正確的位置:
經過修正之後,“shared”和“swap”的地址分別是0x08049108和0x00000009。關於“shared”很好理解,因為“shared”的變數的地址的卻是0x08049108。對於“swap”來說稍顯晦澀。我們前面介紹過,這個“call”指令的下一條指令是一條近址相對位移調用指令,他後面跟的是調用指令的下一條指令的偏移量。