CPU內部的奧秘：代碼是如何被執行的？

我們是袋鼠雲數棧 UED 團隊，致力於打造優秀的一站式數據中台產品。我們始終保持工匠精神，探索前端道路，為社區積累並傳播經驗價值。本文作者：景明我們以一段 C 代碼為例，來看一下代碼被編譯成二進位可執行程式之後，是如何被 CPU 執行的。在這段代碼中，只是做了非常簡單的加法操作，將 x 和 y ...

我們是袋鼠雲數棧 UED 團隊，致力於打造優秀的一站式數據中台產品。我們始終保持工匠精神，探索前端道路，為社區積累並傳播經驗價值。

本文作者：景明

我們以一段 C 代碼為例，來看一下代碼被編譯成二進位可執行程式之後，是如何被 CPU 執行的。

在這段代碼中，只是做了非常簡單的加法操作，將 x 和 y 兩個數字相加得到 z，並返回結果 z。

int main() {
    int x = 1;
    int y = 2;
    int z = x + y;
    return z;
}

我們知道，CPU 並不能直接執行這段 C 代碼，而是需要對其進行編譯，將其轉換為二進位的機器碼，然後 CPU 才能按照順序執行編譯後的機器碼。

先通過 GCC 編譯器將這段 C 代碼編譯成二進位文件，輸入以下命令讓其編譯成目的文件：

gcc -O0 -o code_prog code.c

輸入上面的命令之後回車，在文件夾中生成名為 code_prog 的可執行程式，接下來再將編譯出來的 code_prog 程式進行反彙編，這樣就可以看到二進位代碼和對應的彙編代碼。可以使用 objdump 的完成該任務，命令如下所示：

objdump -d code_prog

最後編譯出來的機器碼如下：

0000000100003f84 <_main>:
100003f84: ff 43 00 d1  	  sub	sp, sp, #16            // 開闢棧空間。即開闢了四個 4 位元組空間
100003f88: ff 0f 00 b9  	  str	wzr, [sp, #12]         // 將 wzr 寄存器的數據存儲到 sp 寄存器的 #12 地址上，設為0
100003f8c: 28 00 80 52  	  mov	w8, #1                 // 創建一個 x = 1，並將 1 存入 w8 寄存器中
100003f90: e8 0b 00 b9  	  str	w8, [sp, #8]           // 將 w8 寄存器的數據存入 sp 寄存器中 #8 的地址中，也就是將 x = 1 存入
100003f94: 48 00 80 52  	  mov	w8, #2                 // 創建一個 y = 2，並將 2 存入 w8 寄存器中
100003f98: e8 07 00 b9  	  str	w8, [sp, #4]           // 將 w8 寄存器的數據存入 sp 寄存器中 #4 的地址中，也就是將 y = 2 存入
100003f9c: e8 0b 40 b9  	  ldr	w8, [sp, #8]           // 讀取 sp 寄存器中 #8 的數據存入 w8 寄存器中，也就是獲取 x = 1
100003fa0: e9 07 40 b9  	  ldr	w9, [sp, #4]           // 讀取 sp 寄存器中 #4 的數據存入 w9 寄存器中，也就是獲取 y = 2
100003fa4: 08 01 09 0b  	  add	w8, w8, w9             // 將 w8、w9 寄存器的 x,y 數據進行相加，並存入 w8 寄存器中，也就是 z = 3
100003fa8: e8 03 00 b9  	  str	w8, [sp]               // 將 w8 寄存器的數據存入 sp 寄存器中
100003fac: e0 03 40 b9  	  ldr	w0, [sp]               // 讀取 sp 寄存器中的數據存到 w0 寄存器中。z = 3
100003fb0: ff 43 00 91  	  add	sp, sp, #16            // 清空開闢的棧空間
100003fb4: c0 03 5f d6  	  ret                        // 返回結果

PS: wzr 為 32 的零寄存器，專門用來清零，也就是 sp 上 #12 指向的數據設置為 0

觀察上方，左邊就是編譯生成的機器碼，在這裡它是使用十六進位來展示的，這主要是因為十六進位比較容易閱讀，所以通常使用十六進位來展示二進位代碼。

可以觀察到上圖是由很多行組成的，每一行都是一個指令，該指令可以讓 CPU 執行指定的任務。

中間的部分是彙編代碼，例如原本是二進位表示的指令，在彙編代碼中可以使用單詞來表示，比如 mov、add 就分別表示數據的存儲和相加。

通常將彙編語言編寫的程式轉換為機器語言的過程稱為“彙編”；反之，機器語言轉化為彙編語言的過程稱為“反彙編”，比如上圖就是對 code_prog 進程進行了反彙編操作。

右邊添加的註釋，表示每條指令的具體含義。

這一大堆指令按照順序集合在一起就組成了程式，所以程式的執行，本質上就是 CPU 按照順序執行這一大堆指令的過程。

CPU 是怎麼執行程式的？

為了更好的分析程式的執行過程，我們還需要瞭解一下基礎的電腦硬體信息，具體如下圖：

file

這張圖是比較通用的系統硬體組織模型圖，它主要是由 CPU、主存儲器、各種 IO 匯流排，還有一些外部設備組成的。

首先，在一個程式執行之前，程式需要被裝進記憶體，比如在 macOS 下麵，你可以通過滑鼠點擊一個可執行文件，當你點擊該文件的時候，系統中的程式載入器會將該文件載入到記憶體中。

CPU 可以通過指定記憶體地址，從記憶體中讀取數據，或者往記憶體中寫入數據，有了記憶體地址，CPU 和記憶體就可以有序地交互。

記憶體中的每個存儲空間都有其對應的獨一無二的地址：

file

在記憶體中，每個存放位元組的空間都有其唯一的地址，而且地址是按照順序排放的。

以開頭代碼為例，這段代碼會被編譯成可執行文件，可執行文件中包含了二進位的機器碼，當二進位代碼被載入進了記憶體後，那麼記憶體中的每條二進位代碼便都有了自己對應的地址，如下圖所示：

file

一旦二進位代碼被裝載進記憶體，CPU 便可以從記憶體中取出一條指令，然後分析該指令，最後執行該指令。

把取出指令、分析指令、執行指令這三個過程稱為一個 CPU 時鐘周期。CPU 是永不停歇的，當它執行完成一條指令之後，會立即從記憶體中取出下一條指令，接著分析該指令，執行該指令，CPU 一直重覆執行該過程，直至所有的指令執行完成。

CPU 是怎麼知道要取出記憶體中的哪條指令呢？：

file

從上圖可以看到 CPU 中有一個 PC 寄存器，它保存了將要執行的指令地址，當二進位代碼被裝載進了記憶體之後，系統會將二進位代碼中的第一條指令的地址寫入到 PC 寄存器中，到了下一個時鐘周期時，CPU 便會根據 PC 寄存器中的地址，從記憶體中取出指令。

PC 寄存器中的指令取出來之後，系統要做兩件事：第一件是將下一條指令的地址更新到 PC 寄存器中，如下圖所示：

file

更新了 PC 寄存器之後，CPU 就會立即做第二件事，那就是分析該指令，並識別出不同的類型的指令，以及各種獲取操作數的方法。

在指令分析完成之後，就要執行指令了。

在執行指令前，我們還需要認識一下 CPU 中的重要部件：寄存器。

寄存器

寄存器是 CPU 中用來存放數據的設備，不同處理器中寄存器的個數也是不一樣的，之所要寄存器，是因為 CPU 訪問記憶體的速度很慢，所以 CPU 就在內部添加了一些存儲設備，這些設備就是寄存器。

他們的讀取速度如下：

file

總結來說，寄存器容量小，讀寫速度快，記憶體容量大，讀寫速度慢。

寄存器通常用來存放數據或者記憶體中某塊數據的地址，我們把這個地址又稱為指針，通常情況下寄存器對存放的數據是沒有特別的限制的，比如某個通用寄存器既可以存儲數據，也可以存儲指針。

不過由於歷史原因，我們還會將某些專用的數據或者指針存儲在專用的通用寄存器中，比如 rbp 寄存器通常用來存放棧幀指針的，rsp 寄存器用來存放棧頂指針的，PC 寄存器用來存放下一條要執行的指令等。

特殊寄存器

Stack Pointer register（SP）

The use of SP as an operand in an instruction, indicates the use of the current stack pointer.
指向當前棧指針。堆棧指針總是指向棧頂位置。一般堆棧的棧底不能動，所以數據入棧前要先修改堆棧指針，使它指向新的空餘空間然後再把數據存進去，出棧的時候相反。

堆棧指針，隨時跟蹤棧頂地址，按"先進後出"的原則存取數據。

Link Register （LR）

連接寄存器，一是用來保存子程式返回地址；二是當異常發生時，LR中保存的值等於異常發生時PC的值減4（或者減2），因此在各種異常模式下可以根據LR的值返回到異常發生前的相應位置繼續執行。

Program Counter（PC）

A 64-bit Program Counter holding the address of the current instruction.
保存了將要執行的指令地址

Word Zero Register（WZR）

零寄存器，用於給int清零

tips

不同指令中寄存器後 #d 有什麼區別？
[#d]在ARM代表的是一個常數表達式。
如：#0x3FC、#0、#0xF0000000、#200、#0xF0000001
都是代表著一個常數。

在 sp 寄存器中，代表的是當前棧頂指針移動的位置。
如：

sub	sp, sp, #16；// 獲取 sp 中的棧頂指針移動 16位的位置，並把位置更新到 sp 寄存器中。實現開闢空間

在通用寄存器 W0 - W11 中，代表的操作的常數值。

mov	w8, #2，// 把常數 2 添加到 w8 寄存器中

通用寄存器

以下介紹下比較常見的通用寄存器：

其中W0~W3 用於函數調用入參，其中，W0 還用於程式的返回值.
W4~W11用於保存局部變數。
W13為SP，時刻指向棧頂，當有數據入棧或出棧時，需要更新SP
W14為鏈接寄存器，主要是用作保存子程式返回的地址。
W15為PC寄存器，指向將要執行的下一條指令地址。

常見指令

mov

數據傳送指令。將立即數或寄存器(operant2)傳送到目標寄存器Rd，可用於移位運算等操作。指令格式如下：

MOV{cond}{S} Rd,operand2

如:

mov w8, #1，就是往 w8 寄存器中寫入 #1.

mov w8, w9，就是把 w9 寄存器的數據發送到 w8 寄存器中，最終 w8 和 w9 寄存器的數據一致。如下圖：

file

ldr

ldr 從記憶體中讀取數據放入寄存器中

LDR{cond}{T} Rd,<地址>;載入指定地址上的數據(字)，放入Rd中

如：

ldr w8, [sp, #8] 讀取 sp 寄存器中 #8 位置的數據存入 w8 寄存器中，改變的只有 w8 ，sp 寄存器不變

str

str 指令用於將寄存器中的數據保存到記憶體

STR{cond}{T} Rd,<地址>;存儲數據(字)到指定地址的存儲單元，要存儲的數據在Rd中

如：
str w8, [sp] ，將 w8 寄存器的數據存入 sp 寄存器中

add

加法運算指令。將operand2 數據與Rn 的值相加，結果保存到Rd 寄存器。指令格式如下：

ADD{cond}{S} Rd,Rn,operand2

以 add w8, w8, w9 為例，就是把 w8、w9 寄存器的 x,y 數據進行相加，並存入 w8 寄存器中

如下圖：

file

sub

減法運算指令。用寄存器 Rn 減去operand2。結果保存到 Rd 中。指令格式如下：

SUB{cond}{S} Rd,Rn,operand2

如：

sub R0,R0,#1 -- R0=R0-1

執行過程

瞭解了以上的知識，我們再來分析一遍代碼的執行過程。

在 C 程式中，CPU 會首先執行調用 main 函數，在調用 main 函數時，生成一塊記憶體空間，用來存放 main 函數執行過程中的數據。

sub	sp, sp, #16

將 0 寫入到 #12 的位元組位置上。

str	wzr, [sp, #12]

接下來給 x 附值

mov	w8, #1
str	w8, [sp, #8]

第一行指令是把 1 添加進寄存器中。第二行指令是把 1 存入 #8 地址的記憶體空間中。

接著給 y 附值

mov	w8, #2
str	w8, [sp, #4]

第一行指令是把 2 添加進寄存器中。第二行指令是把 2 存入 #4 地址的記憶體空間中。

執行完 x， y 的生成，接下來執行 z = x + y

ldr	w8, [sp, #8]
ldr	w9, [sp, #4]
add	w8, w8, w9

第一行指令取出記憶體空間地址為 #8 的數據，也就是 1. 第二行指令去除記憶體空間地址為 #4 的數據，也就是 2，第三行指令則對取出的數據進行相加操作，並將結果 3 存入寄存器中。

str	w8, [sp]
ldr	w0, [sp]

第一行指令把寄存器中的最終的數據存入記憶體中，第二行指令則獲取記憶體中的結果，存入寄存器中。等待返回

add	sp, sp, #16

把開闢的空間進行清理。

ret

返回結果

總結

本文主要講解了 CPU 的執行過程，順便瞭解了一下基礎的電腦硬體信息，如有想法