課程簡介課程目標理解操作系統的設計和實現通過 XV6 操作系統動手實驗，可以擴展或改進操作系統操作系統的目標 Abstraction：對硬體進行抽象 Multiplex：在多個應用程式之間共用硬體資源 Isolation：隔離性，程式出現故障時，不同程式之間不能相互干擾 Sharing：實現 ...

課程簡介

課程目標

理解操作系統的設計和實現
通過 XV6 操作系統動手實驗，可以擴展或改進操作系統

操作系統的目標

Abstraction：對硬體進行抽象
Multiplex：在多個應用程式之間共用硬體資源
Isolation：隔離性，程式出現故障時，不同程式之間不能相互干擾
Sharing：實現共用，如數據交互或協同完成任務
Security：想分享的時候可以分享，不想分享的時候可以不分享，可以稱為 Access Control System
Performance：操作系統至少需要不阻止應用程式獲得高性能，甚至需要幫助應用程式獲取高性能
Range of oses：對於大部分操作系統，需要支持大量不同類型的應用程式

操作系統結構

系統調用函數

read/write 系統調用

read 和 write 函數在執行時，不會關心讀寫的數據格式，操作系統中（內核）copy 程式會按照 8bit 的位元組流處理數據
read 和 write 函數中第一個參數代表文件位置，shell 會確保預設情況下，當一個程式啟動時，文件描述符 0 連接到 console 的輸入，文件描述符 1 連接到了 console 的輸出。

open 系統調用

位元組流就是一段連續的數據按照位元組的長度讀取
open("output.txt", O_WRONLY | O_CREATE); 第二個參數用來告訴 open 系統調用在內核中的實現：我們將要創建並寫入一個文件
文件描述符本質上對應了內核中的一個表單數據。內核維護了每個運行進程的狀態，內核會為每一個運行進程保存一個表單，表單的 key 是文件描述符。這個表單讓內核知道，每個文件描述符對應的實際內容是什麼。這裡比較關鍵的點是，每個進程都有自己獨立的文件描述符空間，所以如果運行了兩個不同的程式，對應兩個不同的進程，如果它們都打開一個文件，它們或許可以得到相同數字的文件描述符，但是因為內核為每個進程都維護了一個獨立的文件描述符空間，這裡相同數字的文件描述符可能會對應到不同的文件。

fork 系統調用

fork 可以創建新的進程，該進程（子進程）與原進程（父進程）的指令、數據、堆棧、文件描述符表單完全相同
fork 有兩個返回值，但是有獨立的地址空間（都認為記憶體從 0 開始增長）
- 在父進程中，返回子進程的 PID
- 在子進程中，返回 0
- 如果創建失敗，返回-1

wait 系統調用

wait 表示等待一個子進程退出
- 如果調用者沒有子進程，則 wait 立即返回-1
- 如果父進程不關註子進程的退出時狀態，可以傳一個 0 地址（或者 NULL 指針）給 wait
```
pid = wait((int *)0);   // 只要一個子進程退出，wait 就結束，返回該退出的子進程的 pid 號
```
- 如果父進程關註子進程的退出時狀態，可以使用如下方式，status將保存子進程結束時的狀態（子進程退出時exit里的參數會被保存到status中）
```
int status；
wait（&status);
```

exit 系統調用

exit 系統調用退出程式，並釋放資源。exit 需要一個整數狀態參數，0 表示成功，1 表示失敗

exec 系統調用

exec 系統調用使用新記憶體映像來替換記憶體的進程
- exec 會保留當前的文件描述符
- 通常 exec 不會返回，只有出錯時才會返回

_char _*argv[3]; 
argv[0] = "echo"; 
argv[1] = "hello"; 
argv[2] = 0;      // 標記了數組的結尾，也可以用NULL指針
exec("/bin/echo", argv);   // 相當於echo hello
printf("exec error\n");    // exec出錯時返回，否則不會運行到這裡了

一般來說 fork 下的子進程中調用 exec 函數來替換子進程，但這樣會造成資源浪費，因此內核通過使用虛擬記憶體技術來進行優化

pipe 系統調用

管道的概念

以文件描述符對的形式提供給進程，一個表示讀端，一個表示寫端
本質是一個偽文件，實質為內核緩衝區
管道實際為內核使用環形隊列機制，藉助內核緩衝區（4K）實現

管道的局限性

必須作用在有血緣關係的進程之間
數據不能進程自己寫，自己讀（需要兩個進程，一個讀，一個寫）
採用半雙工通信，數據只能單方向流動
數據不能反覆讀取

管道函數

int pipe(int fd[2]) ：創建並打開管道

參數：fd[0] 讀端；fd[1] 寫端
返回值：0 成功；-1 失敗

管道程式舉例

int p[2]; 
char *argv[2]; 
argv[0] = "wc"; 
argv[1] = 0; 
pipe(p);            // 創建並打開管道
if (fork() == 0)   // 子進程
{ 
    close(0);     // 釋放文件描述符0（標準輸入）
    dup(p[0]);    // 使得文件描述符0引用了管道讀端p[0]
    close(p[0]);  // 關閉管道讀端
    close(p[1]);  // 關閉管道寫端 
    exec("/bin/wc", argv);  // wc相當於從管道讀數據（這裡其實不太理解，管道不是關上了嗎）
} 
else             // 父進程
{ 
    close(p[0]);   // 讀寫只能有一個，父進程將讀端關閉
    write(p[1], "hello world\n", 12);  // 向管道寫入數據
    close(p[1]);  // 寫完將管道關閉
}

管道的讀寫行為

讀管道：

管道中有數據，read 返回實際讀到的位元組數
管道中無數據：
- 管道寫端全部關閉，read 返回 0
- 管道寫端沒有全部關閉，read 阻塞等待

寫管道：

管道讀端全部關閉，進程異常終止（SIGPIPE 信號導致的）
管道讀端沒有全部關閉：
- 管道已滿，write 阻塞
- 管道未滿，write 將數據寫入，並返回實際寫入的位元組數

File system

文件系統

xv6 文件系統包含了數據文件（擁有位元組數組）和目錄（擁有對數據文件和其他目錄的命名引用）
以 / 開頭的如 /a/b 表示根目錄 / 中 a 目錄中名為 b 的文件或目錄（絕對路徑），不以 / 開頭的是相對於當前目錄的路徑（相對路徑）

chdir 系統調用

通過 chdir 系統調用可以改變進程的當前目錄，如下兩個 open 打開了同一個文件

chdir("/a");
chdir("b");
open("c", O_RDONLY);
open("/a/b/c", O_RDONLY);

創建文件和目錄

mkdir 可以創建一個新的目錄，open 使用 O_CREATE 可以創建新的數據文件，mknod 可以創建一個新的設備文件

mkdir("/dir");
fd = open("/dir/file", O_CREATE | O_WRONLY);
close(fd);

mknod("/console", 1, 1);  // 主設備號，次設備號，唯一標識一個內核設備

當一個進程打開設備文件後，內核會將系統的讀寫調用轉移到內核設備實現上，而不是將它們傳遞給文件系統

文件鏈接

inode 是操作系統用來儲存除了文件名和實際數據的數據結構，它是用來連接實際數據和文件名的；每個 inode 保存著文件的元數據，包括文件的類型（文件 or 目錄 or 設備）、長度、內容在磁碟的位置以及文件的鏈接數量
fstat 系統調用從文件描述符引用的 inode 中檢索信息

// int fstat(int fd, struct stat*)，stat為接收inode信息的結構體，如fstat(fd, &st)
#define T_DIR     1   // Directory
#define T_FILE    2   // File
#define T_DEVICE  3   // Device

struct stat {
  int dev;     // File system's disk device
  uint ino;    // Inode number
  short type;  // Type of file
  short nlink; // Number of links to file
  uint64 size; // Size of file in bytes
};

link 系統調用創建了一個引用同一個 inode 的文件

open("a", O_CREATE | O_WRONLY);
link("a", "b");  // 創建文件b，且a和b指向同一個inode

unlink 系統調用會從文件系統中刪除一個文件名，只有當文件鏈接數為零且沒有文件描述符引用它時，文件 inode 和存放其內容的磁碟空間才會被釋放

unlink("a");   // 刪除a，此時只有b引用inode

// 創建臨時文件的一種慣用方式，它創建一個無名稱的inode，在進程關閉fd或退出時刪除文件
fd = open("/tmp/x", O_CREATE | O_WRONLY);
unlink("/tmp/x");

Linux 命令

xargs 命令

作用：將標準輸入轉為命令行參數；xargs 的作用在於，大多數命令（比如 rm、mkdir、ls）與管道一起使用時，都需要 xargs 將標準輸入轉為命令行參數。

$ echo "hello world" | xargs echo
hello world

上面的代碼將管道左側的標準輸入，轉為命令行參數 hello world，傳給第二個 echo 命令

$ echo "one two three" | xargs mkdir

上面的代碼等同於 mkdir one two three。如果不加 xargs 就會報錯，提示 mkdir 缺少操作參數

命令格式如下：

$ xargs [-options] [command]

真正執行的命令，緊跟在 xargs 後面，接受 xargs 傳來的參數

MIT6.S081 - Lecture1: Introduction and Examples