操作系統通過系統調用為運行於其上的進程提供服務。 當用戶態進程發起一個系統調用, CPU 將切換到 內核態 並開始執行一個 內核函數 。 內核函數負責響應應用程式的要求,例如操作文件、進行網路通訊或者申請記憶體資源等。 原文地址: "https://learn linux.readthedocs.io ...
操作系統通過系統調用為運行於其上的進程提供服務。
當用戶態進程發起一個系統調用, CPU 將切換到 內核態 並開始執行一個 內核函數 。 內核函數負責響應應用程式的要求,例如操作文件、進行網路通訊或者申請記憶體資源等。
原文地址:https://learn-linux.readthedocs.io
玩轉Linux舊群已滿,請加新群:278378501。
歡迎關註我們的公眾號:小菜學編程 (coding-fan)
舉一個最簡單的例子,應用進程需要輸出一行文字,需要調用 write 這個系統調用:
#include <string.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
char *msg = "Hello, world!\n";
write(1, msg, strlen(msg));
return 0;
}
註解
讀者可能會有些疑問——輸出文本不是用 printf 等函數嗎?
確實是。 printf 是更高層次的庫函數,建立在系統調用之上,實現數據格式化等功能。 因此,本質上還是系統調用起決定性作用。
調用流程
那麼,在應用程式內,調用一個系統調用的流程是怎樣的呢?
我們以一個假設的系統調用 xyz 為例,介紹一次系統調用的所有環節。
如上圖,系統調用執行的流程如下:
- 應用程式 代碼調用系統調用( xyz ),該函數是一個包裝系統調用的 庫函數 ;
- 庫函數 ( xyz )負責準備向內核傳遞的參數,並觸發 軟中斷 以切換到內核;
- CPU 被 軟中斷 打斷後,執行 中斷處理函數 ,即 系統調用處理函數 ( system_call);
- 系統調用處理函數 調用 系統調用服務常式 ( sys_xyz ),真正開始處理該系統調用;
執行態切換
應用程式 ( application program )與 庫函數 ( libc )之間, 系統調用處理函數 ( system call handler )與 系統調用服務常式 ( system call service routine )之間, 均是普通函數調用,應該不難理解。 而 庫函數 與 系統調用處理函數 之間,由於涉及用戶態與內核態的切換,要複雜一些。
Linux 通過 軟中斷 實現從 用戶態 到 內核態 的切換。 用戶態 與 內核態 是獨立的執行流,因此在切換時,需要準備 執行棧 並保存 寄存器 。
內核實現了很多不同的系統調用(提供不同功能),而 系統調用處理函數 只有一個。 因此,用戶進程必須傳遞一個參數用於區分,這便是 系統調用號 ( system call number )。 在 Linux 中, 系統調用號 一般通過 eax 寄存器 來傳遞。
總結起來, 執行態切換 過程如下:
- 應用程式 在 用戶態 準備好調用參數,執行 int 指令觸發 軟中斷 ,中斷號為 0x80 ;
- CPU 被軟中斷打斷後,執行對應的 中斷處理函數 ,這時便已進入 內核態 ;
- 系統調用處理函數 準備 內核執行棧 ,並保存所有 寄存器 (一般用彙編語言實現);
- 系統調用處理函數 根據 系統調用號 調用對應的 C 函數—— 系統調用服務常式 ;
- 系統調用處理函數 準備 返回值 並從 內核棧 中恢復 寄存器 ;
- 系統調用處理函數 執行 ret 指令切換回 用戶態 ;
編程實踐
下麵,通過一個簡單的程式,看看應用程式如何在 用戶態 準備參數並通過 int 指令觸發 軟中斷 以陷入 內核態 執行 系統調用 :
.section .rodata
msg:
.ascii "Hello, world!\n"
.section .text
.global _start
_start:
# call SYS_WRITE
movl $4, %eax
# push arguments
movl $1, %ebx
movl $msg, %ecx
movl $14, %edx
int $0x80
# Call SYS_EXIT
movl $1, %eax
# push arguments
movl $0, %ebx
# initiate
int $0x80
這是一個彙編語言程式,程式入口在 *_start* 標簽之後。
第 12 行,準備 系統調用號 :將常數 4 放進 寄存器 eax 。 系統調用號 4 代表 系統調用 SYS_write , 我們將通過該系統調用向標準輸出寫入一個字元串。
第 14-16 行, 準備系統調用參數:第一個參數放進 寄存器 ebx ,第二個參數放進 ecx , 以此類推。
write 系統調用需要 3 個參數:
- 文件描述符 ,標準輸出文件描述符為 1 ;
- 寫入內容(緩衝區)地址;
- 寫入內容長度(位元組數);
第 17 行,執行 int 指令觸發軟中斷 0x80 ,程式將陷入內核態並由內核執行系統調用。 系統調用執行完畢後,內核將負責切換回用戶態,應用程式繼續執行之後的指令( 從 20 行開始 )。
第 20-24 行,調用 exit 系統調用,以便退出程式。
註解
註意到,這裡必須顯式調用 exit 系統調用退出程式。 否則,程式將繼續往下執行,最終遇到 段錯誤 ( segmentation fault )!
讀者可能很好奇——在寫 C 語言或者其他程式時,這個調用並不是必須的!
這是因為 C 庫( libc )已經幫你把臟活累活都幹了。
接下來,我們編譯並執行這個彙編語言程式:
$ ls
hello_world-int.S
$ as -o hello_world-int.o hello_world-int.S
$ ls
hello_world-int.o hello_world-int.S
$ ld -o hello_world-int hello_world-int.o
$ ls
hello_world-int hello_world-int.o hello_world-int.S
$ ./hello_world-int
Hello, world!
其實,將 系統調用號 和 調用參數 放進正確的 寄存器 並觸發正確的 軟中斷 是個重覆的麻煩事。 C 庫已經把這臟累活給幹了——試試 syscall 函數吧!
#include <string.h>
#include <sys/syscall.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
char *msg = "Hello, world!\n";
syscall(SYS_write, 1, msg, strlen(msg));
return 0;
}
下一步
訂閱更新,獲取更多學習資料,請關註我們的 微信公眾號 :
參考文獻
- Serg Iakovlev
- write(2) - Linux manual page
- syscall(2) - Linux manual page
- _exit(2) - Linux manual page