課程簡介 課程目標 理解操作系統的設計和實現 通過 XV6 操作系統動手實驗,可以擴展或改進操作系統 操作系統的目標 Abstraction:對硬體進行抽象 Multiplex:在多個應用程式之間共用硬體資源 Isolation:隔離性,程式出現故障時,不同程式之間不能相互干擾 Sharing:實現 ...
課程簡介
課程目標
- 理解操作系統的設計和實現
- 通過 XV6 操作系統動手實驗,可以擴展或改進操作系統
操作系統的目標
- Abstraction:對硬體進行抽象
- Multiplex:在多個應用程式之間共用硬體資源
- Isolation:隔離性,程式出現故障時,不同程式之間不能相互干擾
- Sharing:實現共用,如數據交互或協同完成任務
- Security:想分享的時候可以分享,不想分享的時候可以不分享,可以稱為 Access Control System
- Performance:操作系統至少需要不阻止應用程式獲得高性能,甚至需要幫助應用程式獲取高性能
- Range of oses:對於大部分操作系統,需要支持大量不同類型的應用程式
操作系統結構
系統調用函數
read/write 系統調用
read
和write
函數在執行時,不會關心讀寫的數據格式,操作系統中(內核)copy 程式會按照 8bit 的位元組流處理數據read
和write
函數中第一個參數代表文件位置,shell 會確保預設情況下,當一個程式啟動時,文件描述符 0 連接到 console 的輸入,文件描述符 1 連接到了 console 的輸出。
open 系統調用
- 位元組流就是一段連續的數據按照位元組的長度讀取
open("output.txt", O_WRONLY | O_CREATE);
第二個參數用來告訴 open 系統調用在內核中的實現:我們將要創建並寫入一個文件- 文件描述符本質上對應了內核中的一個表單數據。內核維護了每個運行進程的狀態,內核會為每一個運行進程保存一個表單,表單的 key 是文件描述符。這個表單讓內核知道,每個文件描述符對應的實際內容是什麼。這裡比較關鍵的點是,每個進程都有自己獨立的文件描述符空間,所以如果運行了兩個不同的程式,對應兩個不同的進程,如果它們都打開一個文件,它們或許可以得到相同數字的文件描述符,但是因為內核為每個進程都維護了一個獨立的文件描述符空間,這裡相同數字的文件描述符可能會對應到不同的文件。
fork 系統調用
-
fork
可以創建新的進程,該進程(子進程)與原進程(父進程)的指令、數據、堆棧、文件描述符表單完全相同 -
fork
有兩個返回值,但是有獨立的地址空間(都認為記憶體從 0 開始增長)- 在父進程中,返回子進程的 PID
- 在子進程中,返回 0
- 如果創建失敗,返回-1
wait 系統調用
-
wait
表示等待一個子進程退出- 如果調用者沒有子進程,則
wait
立即返回-1 - 如果父進程不關註子進程的退出時狀態,可以傳一個
0
地址(或者NULL
指針)給wait
pid = wait((int *)0); // 只要一個子進程退出,wait 就結束,返回該退出的子進程的 pid 號
- 如果父進程關註子進程的退出時狀態,可以使用如下方式,
status
將保存子進程結束時的狀態(子進程退出時exit
里的參數會被保存到status
中)
int status; wait(&status);
- 如果調用者沒有子進程,則
exit 系統調用
exit
系統調用退出程式,並釋放資源。exit
需要一個整數狀態參數,0 表示成功,1 表示失敗
exec 系統調用
exec
系統調用使用新記憶體映像來替換記憶體的進程exec
會保留當前的文件描述符- 通常
exec
不會返回,只有出錯時才會返回
_char _*argv[3];
argv[0] = "echo";
argv[1] = "hello";
argv[2] = 0; // 標記了數組的結尾,也可以用NULL指針
exec("/bin/echo", argv); // 相當於echo hello
printf("exec error\n"); // exec出錯時返回,否則不會運行到這裡了
- 一般來說
fork
下的子進程中調用exec
函數來替換子進程,但這樣會造成資源浪費,因此內核通過使用虛擬記憶體技術來進行優化
pipe 系統調用
管道的概念
- 以文件描述符對的形式提供給進程,一個表示讀端,一個表示寫端
- 本質是一個偽文件,實質為內核緩衝區
- 管道實際為內核使用環形隊列機制,藉助內核緩衝區(4K)實現
管道的局限性
- 必須作用在有血緣關係的進程之間
- 數據不能進程自己寫,自己讀(需要兩個進程,一個讀,一個寫)
- 採用半雙工通信,數據只能單方向流動
- 數據不能反覆讀取
管道函數
int pipe(int fd[2])
:創建並打開管道
- 參數:
fd[0]
讀端;fd[1]
寫端 - 返回值:
0
成功;-1
失敗
管道程式舉例
int p[2];
char *argv[2];
argv[0] = "wc";
argv[1] = 0;
pipe(p); // 創建並打開管道
if (fork() == 0) // 子進程
{
close(0); // 釋放文件描述符0(標準輸入)
dup(p[0]); // 使得文件描述符0引用了管道讀端p[0]
close(p[0]); // 關閉管道讀端
close(p[1]); // 關閉管道寫端
exec("/bin/wc", argv); // wc相當於從管道讀數據(這裡其實不太理解,管道不是關上了嗎)
}
else // 父進程
{
close(p[0]); // 讀寫只能有一個,父進程將讀端關閉
write(p[1], "hello world\n", 12); // 向管道寫入數據
close(p[1]); // 寫完將管道關閉
}
管道的讀寫行為
- 讀管道:
-
管道中有數據,
read
返回實際讀到的位元組數 -
管道中無數據:
- 管道寫端全部關閉,
read
返回 0 - 管道寫端沒有全部關閉,
read
阻塞等待
- 管道寫端全部關閉,
- 寫管道:
-
管道讀端全部關閉,進程異常終止(SIGPIPE 信號導致的)
-
管道讀端沒有全部關閉:
- 管道已滿,
write
阻塞 - 管道未滿,
write
將數據寫入,並返回實際寫入的位元組數
- 管道已滿,
File system
文件系統
- xv6 文件系統包含了數據文件(擁有位元組數組)和目錄(擁有對數據文件和其他目錄的命名引用)
- 以
/
開頭的如/a/b
表示根目錄/
中a
目錄中名為b
的文件或目錄(絕對路徑),不以/
開頭的是相對於當前目錄的路徑(相對路徑)
chdir 系統調用
通過 chdir
系統調用可以改變進程的當前目錄,如下兩個 open
打開了同一個文件
chdir("/a");
chdir("b");
open("c", O_RDONLY);
open("/a/b/c", O_RDONLY);
創建文件和目錄
mkdir
可以創建一個新的目錄,open
使用 O_CREATE
可以創建新的數據文件,mknod
可以創建一個新的設備文件
mkdir("/dir");
fd = open("/dir/file", O_CREATE | O_WRONLY);
close(fd);
mknod("/console", 1, 1); // 主設備號,次設備號,唯一標識一個內核設備
當一個進程打開設備文件後,內核會將系統的讀寫調用轉移到內核設備實現上,而不是將它們傳遞給文件系統
文件鏈接
inode
是操作系統用來儲存除了文件名和實際數據的數據結構,它是用來連接實際數據和文件名的;每個inode
保存著文件的元數據,包括文件的類型(文件 or 目錄 or 設備)、長度、內容在磁碟的位置以及文件的鏈接數量fstat
系統調用從文件描述符引用的 inode 中檢索信息
// int fstat(int fd, struct stat*),stat為接收inode信息的結構體,如fstat(fd, &st)
#define T_DIR 1 // Directory
#define T_FILE 2 // File
#define T_DEVICE 3 // Device
struct stat {
int dev; // File system's disk device
uint ino; // Inode number
short type; // Type of file
short nlink; // Number of links to file
uint64 size; // Size of file in bytes
};
link
系統調用創建了一個引用同一個inode
的文件
open("a", O_CREATE | O_WRONLY);
link("a", "b"); // 創建文件b,且a和b指向同一個inode
unlink
系統調用會從文件系統中刪除一個文件名,只有當文件鏈接數為零且沒有文件描述符引用它時,文件inode
和存放其內容的磁碟空間才會被釋放
unlink("a"); // 刪除a,此時只有b引用inode
// 創建臨時文件的一種慣用方式,它創建一個無名稱的inode,在進程關閉fd或退出時刪除文件
fd = open("/tmp/x", O_CREATE | O_WRONLY);
unlink("/tmp/x");
Linux 命令
xargs 命令
- 作用:將標準輸入轉為命令行參數;
xargs
的作用在於,大多數命令(比如rm
、mkdir
、ls
)與管道一起使用時,都需要xargs
將標準輸入轉為命令行參數。
$ echo "hello world" | xargs echo
hello world
上面的代碼將管道左側的標準輸入,轉為命令行參數 hello world
,傳給第二個 echo
命令
$ echo "one two three" | xargs mkdir
上面的代碼等同於 mkdir one two three
。如果不加 xargs
就會報錯,提示 mkdir
缺少操作參數
- 命令格式如下:
$ xargs [-options] [command]
真正執行的命令,緊跟在 xargs
後面,接受 xargs
傳來的參數