文件系統: 以UNIX系統V文件系統為例: 磁碟分為區,每個分區都有自己的文件系統: i節點是固定長度的記錄項,包含了文件的相關信息。目錄項包含文件名和i節點號。stat結構中除文件名和i節點編號之外的數據都包含在i節點中 在進行文件索引的時候會首先找到目錄項,根據目錄項的i節點號找到i節點,i ...
文件系統:
以UNIX系統V文件系統為例:
磁碟分為區,每個分區都有自己的文件系統:
i節點是固定長度的記錄項,包含了文件的相關信息。目錄項包含文件名和i節點號。stat結構中除文件名和i節點編號之外的數據都包含在i節點中
在進行文件索引的時候會首先找到目錄項,根據目錄項的i節點號找到i節點,i節點中包含了若幹數據塊的引用,這些數據塊就是文件內容。目錄項只是對i節點的引用
多個目錄項可以引用相同的i節點,i節點將記錄引用它的目錄項的個數,只有在沒有目錄項引用它的時候才可以刪除其中的數據。所以刪除一個目錄項並不意味著一定刪除對應的數據。這種連接被稱為硬鏈接。與之相對的是符號鏈接:i節點指向的實際文件內容是另一個文件的名字,i節點中的文件類型將指示這是否是個符號鏈接
目錄項中的i節點編號指向的是同一文件系統中的i節點,不能使用另一個文件系統的i節點
文件重命名只是構造一個新的指向對應i節點的目錄項並刪除現有的目錄項,而不會改變文件的實質內容
link/unlink/remove/rename函數:
link函數創建已有文件的連接:參數為現有文件路徑和新文件路徑,成功後新文件路徑將引用和現有文件路徑相同的文件內容,如果新文件路徑已經存在就返回錯誤。創建新目錄項和增加連接計數應是原子操作
只有超級用戶才可以創建指向目錄的連接,因為這可能會導致文件系統中形成迴圈,大多數文件系統公有函數無法處理迴圈
unlink刪除現有目錄項,內核先後檢查打開該文件的進程數和i節點的連接計數,如果都是0就刪除文件內容。如果參數是符號鏈接,那麼刪除的是符號鏈接而不涉及其指向的文件內容
remove對於文件和unlink相同,對於目錄和rmdir相同
將oldname指向的文件更名為newname
- oldname是文件而不是目錄。如果newname已存在,則不能為目錄,刪除newname的目錄項,並將oldname更名為newname
- oldname是目錄。如果newname已存在,則必須為空目錄(目錄下只有"."和".."),刪除newname的目錄項。將oldname更名為newname。oldname不能是newname的路徑首碼
oldname和newname指向同一文件。不做處理直接返回成功
符號連接:
符號連接的目的是避免硬連接的某些限制:
- 硬鏈接通常要求和文件位於同一個文件系統
- 只有超級用戶才能創建目錄的硬連接
需要註意文件處理函數是否能夠處理符號連接
在文件系統中形成迴圈的符號連接可以很容易通過unlink函數刪除,因為unlink不跟隨符號連接。但是形成迴圈的硬連接很難刪除
符號連接存在,但是其指向的文件可能不存在,所以在使用open函數打開一個存在的符號連接可能會因為目標文件不存在而產生錯誤
symlink和readlink函數:
symlink函數創建一個符號連接,不要求被指向的文件存在或者存在於同一個文件系統
因為open函數會跟隨符號連接,所以需要使用readlink函數讀取符號連接相關的信息
mkdir和rmdir函數:
mkdir創建目錄,rmdir刪除目錄
創建的新的空目錄,"."和".."自動創建,文件存取許可權按照進程在創建之前設置的文件方式屏蔽字設置
rmdir可以刪除空目錄。如果調用使得目錄的連接計數為0並且沒有其他進程打開目錄,就釋放目錄占用的空間。如果有其他的進程打開此目錄,就在函數返回之前刪除最後的連接以及"."和"..",但是在最後一個進程釋放它之前不會釋放它占用的空間。此目錄下將無法再創建文件
讀目錄:
對目錄有存取許可權的用戶都可以讀目錄,只有內核可以寫目錄
目錄的寫和執行許可權只是可以在該目錄下創建或者刪除文件
chdir/fchdir/getcwd函數:
進程使用chdir和fchdir函數更改當前工作目錄
內核為進程維護當前工作目錄的時候只維護其i節點編號及設備標識,所以沒有完整的路徑名。可以使用函數getcwd獲取完整的路徑
sync和fsync函數:
UNIX系統在內核實現了緩衝器,大多數磁碟I/O將先寫到緩衝(即記憶體)裡面,之後再寫到磁碟中。當系統故障時可能會有數據沒有寫到磁碟中
sync函數將所有緩衝中修改過的塊排入寫磁碟隊列,然後返回,不等待I/O結束。系統精靈進程將會每隔一段時間調用sync
fsync函數只對單個文件起作用,將文件內容更新到磁碟中,等待I/O結束再返回。O_SYNC與之不同的是每次調用write都會直接更新文件內容到磁碟
stat:
來自gcc version 7.3.0的sys/stat.h文件
struct stat { unsigned long st_dev; /* Device. */ unsigned long st_ino; /* File serial number. */ unsigned int st_mode; /* File mode. */ unsigned int st_nlink; /* Link count. */ unsigned int st_uid; /* User ID of the file's owner. */ unsigned int st_gid; /* Group ID of the file's group. */ unsigned long st_rdev; /* Device number, if device. */ unsigned long __pad1; long st_size; /* Size of file, in bytes. */ int st_blksize; /* Optimal block size for I/O. */ int __pad2; long st_blocks; /* Number 512-byte blocks allocated. */ long st_atime; /* Time of last access. */ unsigned long st_atime_nsec; long st_mtime; /* Time of last modification. */ unsigned long st_mtime_nsec; long st_ctime; /* Time of last status change. */ unsigned long st_ctime_nsec; unsigned int __unused4; unsigned int __unused5; };
st_dev/st_rdev
每個文件系統都有主、次設備號,存放於基本系統數據類型dev_t。在這裡是unsigned long類型,這個unsigned long通過特定的方式解析為主設備號和次設備號。
系統中每個文件的st_dev包含的是文件系統的主次設備號。只有字特殊文件和塊特殊文件才有st_rdev值,包含實際設備的設備號
使用major和minor函數從dev_t類型中存取主次設備號
st_ino
i節點號
st_mode
有三部分可以從此數字解析:存取許可權、文件類型、設置-用戶/組-ID位
文件類型:
- 普通文件:文件中包含某種形式的數據,內核不關心數據,數據解析由相關應用程式完成
- 目錄文件:包含了其他文件的名字以及指向與這些文件有關信息的指針。任何有訪問許可權的進程都可以訪問目錄的內容,但是只有內核可以寫目錄文件
- 字元特殊文件:用於系統中某些類型的設備
- 快特殊文件:典型的用於磁碟設備。系統中所有設備是字特殊文件或者是塊特殊文件
- FIFO:命名管道
- socket:用於進程間通信的文件
- 符號鏈接:此種文件指向另一個文件
文件類型可以通過在stat.h中定義的巨集判斷:
S_ISLNK:符號連接
S_ISREG:普通文件
S_ISDIR:目錄文件
S_ISCHR:字元特殊文件
S_ISBLK:塊特殊文件
S_ISFIFO:管道
S_ISSOCK:套接字
文件許可權:
文件有9個主要的許可權,下麵是許可權位的掩碼(來自stat.h):
// 所有者(用戶)許可權位
#define S_IRWXU 00700 /* 用戶讀寫執行 */ #define S_IRUSR 00400 /* 用戶讀 */ #define S_IWUSR 00200 /* 用戶寫 */ #define S_IXUSR 00100 /* 用戶執行 */
// 組許可權位 #define S_IRWXG 00070 /* 組讀寫執行 */ #define S_IRGRP 00040 /* 組讀 */ #define S_IWGRP 00020 /* 組寫 */ #define S_IXGRP 00010 /* 組執行 */
// 其他許可權位 #define S_IRWXO 00007 /* 其它讀寫執行 */ #define S_IROTH 00004 /* 其它讀 */ #define S_IWOTH 00002 /* 其它寫 */ #define S_IXOTH 00001 /* 其它執行 */
分為三組,每組的第一個是其餘三個掩碼的按位或,所以實際上還是9個許可權位。
chmod和fchmod函數用於改變文件的存取許可權位,前者使用文件名作為參數,後者使用打開的文件作為參數
下列情況下這兩個函數對於某個許可權位將不會按照參數中的許可權進行設置,而是將對應的許可權位清空:
- 在沒有超級用戶許可權的情況下,試圖設置文件的粘住位。此時粘住位將被置0
- 在沒有超級用戶許可權的情況下,試圖設置文件的組ID為既不是創建進程的有效組ID也不是創建進程的添加組ID。此時設置-組ID位將被置0
許可權位測試:
進程在打開、創建或刪除文件的時候,將會按照以下步驟進行文件的許可權位測試:
- 若進程的有效用戶ID是超級用戶,則允許任意的存取。否則進入下一步
- 若進程的有效用戶ID是文件的所有者ID,則按照文件的三個所有者許可權位。否則進入下一步
- 若進程的有效組ID或添加組ID是文件的組ID,將按照文件的三個組許可權位。否則進入下一步
- 按照文件的三個其他許可權位
設置-用戶/組-ID位 :(兩位,分別對應用戶和組)
進程有以下ID:
- 實際用戶/組ID:實際執行進程者
- 有效用戶/組ID,添加組ID:用於文件存取許可權測試
- 保存設置用戶/組ID
通常情況下有效用戶/組ID就是實際用戶/組ID,但是可以通過設置文件st_mode中的設置-用戶/組-ID位來使進程在打開該文件的時候有效用戶/組ID為文件的所有者
兩位通過S_ISUID和S_ISGID巨集測試
粘住位:
早期UNIX系統中,交換區的文件是連續存放的,而其他的位置可能是隨機存放的。所以可以使用粘住位將一個可執行程式文件的正文(機器指令部分)固定在交換區,下次執行的時候將能夠更快的放入記憶體。但是較新的UNIX系統都具有虛擬記憶體和快速文件系統,所以不再需要這種技術
SVR4和4.3+BSD中粘住位主要針對目錄,在目錄設置了粘住位之後,對該目錄具有寫許可權的用戶在滿足下列情況之一的情況下才可以刪除或重命名目錄下的文件:擁有文件/擁有目錄/超級用戶
umask函數:
用於設置和進程相關的文件方式創建屏蔽字。在進程創建文件的時候就會根據文件方式創建屏蔽字以及創建時指定的許可權為文件設置讀寫許可權。
文件方式創建屏蔽字為1的位,無論創建時指定的許可權位為0/1都會將對應的許可權位設置為0
st_uid/st_gid
新文件的用戶/組ID:
在創建新文件、目錄的時候,新文件的用戶ID為創建進程的有效用戶ID
POSIX規定,組ID可以通過下麵兩種方式之一確定:
- 進程的有效組ID
- 所在目錄的組ID
SVR4系統中,如果文件的設置組ID位被設置,那麼新文件的組ID為所在目錄的組ID,否則為進程的有效組ID
4.3+BSD系統中始終使用所在目錄的組ID
access函數:
驗證實際用戶對文件的存取許可權
以文件路徑的方式指定需檢查的文件,第二個參數指定需要檢查的項
- R_OK 測試讀許可權
- W_OK 測試寫許可權
- X_OK 測試執行許可權
- F_OK 測試文件是否存在
chown/fchown/lchown函數:
用於更改文件的用戶ID和組ID
符號鏈接:lchown更改符號鏈接本身的所有者,其他兩個更改符號鏈接指向的文件的所有者
只有SVR4支持lchown,在非SVR4系統中,如果chown的參數是符號鏈接就改變其本身的所有者,如果想要改變其指向的文件,就需要直接指定該文件
POSIX.1規定按照_POSIX_CHOWN_RESTRICTED的值設置更改文件所有者是否受限
若起作用,則:
- 只有超級用戶才能改變文件的用戶ID
- 在下列情況下非超級用戶可以改變文件的組ID
- 進程的有效用戶ID為文件的用戶ID
- 參數owner等於文件的用戶ID,參數group等於進程的有效組ID或者進程的添加組ID
函數在被非超級用戶調用併成功返回後文件的設置-用戶ID和設置-組ID被清除
st_size
指明文件長度,只對普通文件、符號連接、目錄文件起作用。SVR4支持對管道表示管道中可讀取的位元組數
符號鏈接的長度表示其指向文件名的位元組數,因有長度指定,所以不以null結尾
普通文件的長度可以為0,但是目錄和符號連接不會為0。因為目錄至少包含"."和".."兩項,符號連接的文件內容是文件路徑,文件路徑至少有一個字元
SVR4和4.3+BSD支持使用st_blksize和st_blocks表示塊大小和塊數
文件空洞:偏移量超過文件結尾進行寫數據,文件結尾和新寫的數據之間就是文件空洞。
文件空洞不會用實際的空間存儲,所以st_size要比st_blksize*block得到的大(即便除去額外的維護所需空間)。使用read()函數讀取得到的是0。
但是如果使用如cat(1)進行文件複製,會將空洞複製為實際的位元組0而占用實際的存儲空間
文件截短:
使用truncate和ftruncate將文件截短至指定的長度
對於文件長度大於截斷長度的,截斷長度之後的內容無法讀取
對於文件長度小於截斷長度的,根據實際實現的系統而定
st_atime/st_mtime/st_ctime
每個文件都有三個時間:
- st_atime:文件數據的最後存取時間
- st_mtime:文件數據的最後修改時間
- st_ctime:i節點狀態的最後修改時間
utime函數用於更改一個文件的存取和修改時間
參數需傳遞一個包含兩個時間的結構體
- 結構體為null:將存取時間和修改時間設置為當前時間。需要滿足進程的有效用戶ID為文件的所有者ID或者進程對該文件有寫許可權
- 結構體不為null:將存取時間和修改時間設置為指定的值。需要滿足進程的有效用戶ID為文件的所有者ID或者進程是超級用戶進程
不能修改修改狀態時間(st_ctime)