程式在記憶體中的存儲分為三個區域,分別是動態數據區、靜態數據區和代碼區。函數存儲在代碼區,全局變數以及靜態變數存儲在靜態數據區,而在程式執行的時候才會在動態數據區產生數據。程式執行的本質就是代碼區的指令不斷執行,驅使動態數據區和靜態數據區產生數據變化。 代碼區與動態數據區由三個寄存器控制,分別是eip ...
程式在記憶體中的存儲分為三個區域,分別是動態數據區、靜態數據區和代碼區。函數存儲在代碼區,全局變數以及靜態變數存儲在靜態數據區,而在程式執行的時候才會在動態數據區產生數據。程式執行的本質就是代碼區的指令不斷執行,驅使動態數據區和靜態數據區產生數據變化。
代碼區與動態數據區由三個寄存器控制,分別是eip、ebp和esp。eip指向代碼區下一個要執行的指令,ebp與esp分別指向動態數據區的棧底和棧頂。初始情況下eip預設指向main函數的第一條指令,esp、ebp指向的位置由程式載入時內核的設置決定。
我們看一下這段代碼如何執行的,在執行第一條指令時,考慮到函數調用的問題,ebp會先把當前指向的地址記錄到棧中,方便以後返回來繼續執行。把地址壓進棧時,esp就會自動往棧頂方向移動。說到這裡,為避免混淆先科普一下什麼是棧頂和棧底,棧只允許在一端做插入和刪除操作,這一端就叫棧頂,而另一端叫做棧底,圖中下方叫棧頂,上方叫棧底。esp永遠在棧頂,也就是圖的最下方。
由於esp指向的地址已經被記錄,那麼它就被空閑出來了。現在我們開始構建main函數的棧,空閑的esp幫忙看著main函數的棧底。這個時候esp與ebp是重疊的。
eip繼續指向下一條指令,到了局部變數i的初始化,這裡將i賦值為4,就將i的初始值壓到棧中,esp繼續往棧頂移動。下一條指令與本條相同,將局部變數j也壓入棧中,如圖所示。
接下來調用了fun函數,雖然fun函數是獨立的函數,但是由於是在main函數中調用的,所以依然將數據壓至main函數的棧中。fun函數的傳入參數為i、j,但是入棧的順序正好相反,b先入棧,然後a被壓入棧中,如圖所示。
接下來要跳轉到fun函數了,在跳轉之前,我們要先給fun函數的返回值留個位置,因為要賦值給局部變數m的。然後再將fun函數的返回地址壓入棧中,方便執行完fun函數後能繼續往下執行。最後再把ebp當前的地址值壓入棧中,此時ebp指向的是main函數的棧底(如果這裡不做保存,fun函數執行完ebp就回不去了)。
接下來就正式進入了fun函數,像第一次保存完地址值那樣,ebp又被閑置了,所以讓ebp守住fun函數的棧底。而局部變數b與c的賦值就不再多說,與main函數的執行過程相同,當走到了return時,將計算出的結果賦值寫入到剛空出的返回值那裡。
此時的fun函數就執行完畢了,我們要恢復main函數調用fun函數的現場,繼續往下執行,要想往下執行,必須將ebp回到main函數的棧底,並且找到fun函數返回的位置,然後跳轉到那裡。很簡單,由於剛纔保存了ebp的地址值,所以將地址值賦值給ebp,ebp就指向了main函數的棧底。
ebp的地址值出棧後,esp就指向了fun函數的返回地址,通過執行ret指令,把該地址值傳給eip,使eip指向fun函數執行後的返回地址。
這樣就恢復了現場,然後把fun函數的返回值傳遞給m,此時局部變數b、a和返回值已經沒有價值了,把它們清出棧,現在就剩下乾乾凈凈的棧內容了。
現在執行最後一步,main函數就結束了,此時局部變數i、j也沒有任何作用,做清棧操作,清理出乾凈的棧空間。
以上便是一個簡單C程式的運行時結構。本文總結於新設計團隊的《編譯系統透視:圖解編譯原理》,圖侵刪。