UNIX系統高級編程——第四章-文件和目錄-總結

来源:https://www.cnblogs.com/biaoJM/archive/2018/12/27/10185095.html
-Advertisement-
Play Games

文件系統: 以UNIX系統V文件系統為例: 磁碟分為區,每個分區都有自己的文件系統: ​ i節點是固定長度的記錄項,包含了文件的相關信息。目錄項包含文件名和i節點號。stat結構中除文件名和i節點編號之外的數據都包含在i節點中 在進行文件索引的時候會首先找到目錄項,根據目錄項的i節點號找到i節點,i ...


文件系統:

以UNIX系統V文件系統為例:

磁碟分為區,每個分區都有自己的文件系統:


i節點是固定長度的記錄項,包含了文件的相關信息。目錄項包含文件名和i節點號。stat結構中除文件名和i節點編號之外的數據都包含在i節點中

在進行文件索引的時候會首先找到目錄項,根據目錄項的i節點號找到i節點,i節點中包含了若幹數據塊的引用,這些數據塊就是文件內容。目錄項只是對i節點的引用

多個目錄項可以引用相同的i節點,i節點將記錄引用它的目錄項的個數,只有在沒有目錄項引用它的時候才可以刪除其中的數據。所以刪除一個目錄項並不意味著一定刪除對應的數據。這種連接被稱為硬鏈接。與之相對的是符號鏈接:i節點指向的實際文件內容是另一個文件的名字,i節點中的文件類型將指示這是否是個符號鏈接

目錄項中的i節點編號指向的是同一文件系統中的i節點,不能使用另一個文件系統的i節點

文件重命名只是構造一個新的指向對應i節點的目錄項並刪除現有的目錄項,而不會改變文件的實質內容

link/unlink/remove/rename函數:

link函數創建已有文件的連接:參數為現有文件路徑和新文件路徑,成功後新文件路徑將引用和現有文件路徑相同的文件內容,如果新文件路徑已經存在就返回錯誤。創建新目錄項和增加連接計數應是原子操作

只有超級用戶才可以創建指向目錄的連接,因為這可能會導致文件系統中形成迴圈,大多數文件系統公有函數無法處理迴圈

unlink刪除現有目錄項,內核先後檢查打開該文件的進程數和i節點的連接計數,如果都是0就刪除文件內容。如果參數是符號鏈接,那麼刪除的是符號鏈接而不涉及其指向的文件內容

remove對於文件和unlink相同,對於目錄和rmdir相同

將oldname指向的文件更名為newname

  • oldname是文件而不是目錄。如果newname已存在,則不能為目錄,刪除newname的目錄項,並將oldname更名為newname
  • oldname是目錄。如果newname已存在,則必須為空目錄(目錄下只有"."和".."),刪除newname的目錄項。將oldname更名為newname。oldname不能是newname的路徑首碼

oldname和newname指向同一文件。不做處理直接返回成功

符號連接:

符號連接的目的是避免硬連接的某些限制:

  • 硬鏈接通常要求和文件位於同一個文件系統
  • 只有超級用戶才能創建目錄的硬連接

需要註意文件處理函數是否能夠處理符號連接

在文件系統中形成迴圈的符號連接可以很容易通過unlink函數刪除,因為unlink不跟隨符號連接。但是形成迴圈的硬連接很難刪除

符號連接存在,但是其指向的文件可能不存在,所以在使用open函數打開一個存在的符號連接可能會因為目標文件不存在而產生錯誤

symlink和readlink函數:

symlink函數創建一個符號連接,不要求被指向的文件存在或者存在於同一個文件系統

因為open函數會跟隨符號連接,所以需要使用readlink函數讀取符號連接相關的信息

mkdir和rmdir函數:

mkdir創建目錄,rmdir刪除目錄

創建的新的空目錄,"."和".."自動創建,文件存取許可權按照進程在創建之前設置的文件方式屏蔽字設置

rmdir可以刪除空目錄。如果調用使得目錄的連接計數為0並且沒有其他進程打開目錄,就釋放目錄占用的空間。如果有其他的進程打開此目錄,就在函數返回之前刪除最後的連接以及"."和"..",但是在最後一個進程釋放它之前不會釋放它占用的空間。此目錄下將無法再創建文件

讀目錄:

對目錄有存取許可權的用戶都可以讀目錄,只有內核可以寫目錄

目錄的寫和執行許可權只是可以在該目錄下創建或者刪除文件

chdir/fchdir/getcwd函數:

進程使用chdir和fchdir函數更改當前工作目錄

內核為進程維護當前工作目錄的時候只維護其i節點編號及設備標識,所以沒有完整的路徑名。可以使用函數getcwd獲取完整的路徑

sync和fsync函數:

UNIX系統在內核實現了緩衝器,大多數磁碟I/O將先寫到緩衝(即記憶體)裡面,之後再寫到磁碟中。當系統故障時可能會有數據沒有寫到磁碟中

sync函數將所有緩衝中修改過的塊排入寫磁碟隊列,然後返回,不等待I/O結束。系統精靈進程將會每隔一段時間調用sync

fsync函數只對單個文件起作用,將文件內容更新到磁碟中,等待I/O結束再返回。O_SYNC與之不同的是每次調用write都會直接更新文件內容到磁碟

stat:

來自gcc version 7.3.0的sys/stat.h文件

struct stat {
    unsigned long    st_dev;        /* Device.  */
    unsigned long    st_ino;        /* File serial number.  */
    unsigned int    st_mode;    /* File mode.  */
    unsigned int    st_nlink;    /* Link count.  */
    unsigned int    st_uid;        /* User ID of the file's owner.  */
    unsigned int    st_gid;        /* Group ID of the file's group. */
    unsigned long    st_rdev;    /* Device number, if device.  */
    unsigned long    __pad1;
    long        st_size;    /* Size of file, in bytes.  */
    int        st_blksize;    /* Optimal block size for I/O.  */
    int        __pad2;
    long        st_blocks;    /* Number 512-byte blocks allocated. */
    long        st_atime;    /* Time of last access.  */
    unsigned long    st_atime_nsec;
    long        st_mtime;    /* Time of last modification.  */
    unsigned long    st_mtime_nsec;
    long        st_ctime;    /* Time of last status change.  */
    unsigned long    st_ctime_nsec;
    unsigned int    __unused4;
    unsigned int    __unused5;
};

st_dev/st_rdev

每個文件系統都有主、次設備號,存放於基本系統數據類型dev_t。在這裡是unsigned long類型,這個unsigned long通過特定的方式解析為主設備號和次設備號。

系統中每個文件的st_dev包含的是文件系統的主次設備號。只有字特殊文件和塊特殊文件才有st_rdev值,包含實際設備的設備號

使用major和minor函數從dev_t類型中存取主次設備號

st_ino

i節點號

st_mode

有三部分可以從此數字解析:存取許可權、文件類型、設置-用戶/組-ID位

文件類型:

  • 普通文件:文件中包含某種形式的數據,內核不關心數據,數據解析由相關應用程式完成
  • 目錄文件:包含了其他文件的名字以及指向與這些文件有關信息的指針。任何有訪問許可權的進程都可以訪問目錄的內容,但是只有內核可以寫目錄文件
  • 字元特殊文件:用於系統中某些類型的設備
  • 快特殊文件:典型的用於磁碟設備。系統中所有設備是字特殊文件或者是塊特殊文件
  • FIFO:命名管道
  • socket:用於進程間通信的文件
  • 符號鏈接:此種文件指向另一個文件

文件類型可以通過在stat.h中定義的巨集判斷:

S_ISLNK:符號連接
S_ISREG:普通文件
S_ISDIR:目錄文件
S_ISCHR:字元特殊文件
S_ISBLK:塊特殊文件
S_ISFIFO:管道
S_ISSOCK:套接字

文件許可權:

文件有9個主要的許可權,下麵是許可權位的掩碼(來自stat.h):

// 所有者(用戶)許可權位
#define
S_IRWXU 00700 /* 用戶讀寫執行 */ #define S_IRUSR 00400 /* 用戶讀 */ #define S_IWUSR 00200 /* 用戶寫 */ #define S_IXUSR 00100 /* 用戶執行 */
// 組許可權位 #define S_IRWXG 00070 /* 組讀寫執行 */ #define S_IRGRP 00040 /* 組讀 */ #define S_IWGRP 00020 /* 組寫 */ #define S_IXGRP 00010 /* 組執行 */
// 其他許可權位 #define S_IRWXO 00007 /* 其它讀寫執行 */ #define S_IROTH 00004 /* 其它讀 */ #define S_IWOTH 00002 /* 其它寫 */ #define S_IXOTH 00001 /* 其它執行 */

分為三組,每組的第一個是其餘三個掩碼的按位或,所以實際上還是9個許可權位。

chmod和fchmod函數用於改變文件的存取許可權位,前者使用文件名作為參數,後者使用打開的文件作為參數

下列情況下這兩個函數對於某個許可權位將不會按照參數中的許可權進行設置,而是將對應的許可權位清空:

  • 在沒有超級用戶許可權的情況下,試圖設置文件的粘住位。此時粘住位將被置0
  • 在沒有超級用戶許可權的情況下,試圖設置文件的組ID為既不是創建進程的有效組ID也不是創建進程的添加組ID。此時設置-組ID位將被置0

許可權位測試:

進程在打開、創建或刪除文件的時候,將會按照以下步驟進行文件的許可權位測試:

  1. 若進程的有效用戶ID是超級用戶,則允許任意的存取。否則進入下一步
  2. 若進程的有效用戶ID是文件的所有者ID,則按照文件的三個所有者許可權位。否則進入下一步
  3. 若進程的有效組ID或添加組ID是文件的組ID,將按照文件的三個組許可權位。否則進入下一步
  4. 按照文件的三個其他許可權位

設置-用戶/組-ID位 :(兩位,分別對應用戶和組)

進程有以下ID:

  • 實際用戶/組ID:實際執行進程者
  • 有效用戶/組ID,添加組ID:用於文件存取許可權測試
  • 保存設置用戶/組ID

通常情況下有效用戶/組ID就是實際用戶/組ID,但是可以通過設置文件st_mode中的設置-用戶/組-ID位來使進程在打開該文件的時候有效用戶/組ID為文件的所有者

兩位通過S_ISUID和S_ISGID巨集測試

粘住位:

早期UNIX系統中,交換區的文件是連續存放的,而其他的位置可能是隨機存放的。所以可以使用粘住位將一個可執行程式文件的正文(機器指令部分)固定在交換區,下次執行的時候將能夠更快的放入記憶體。但是較新的UNIX系統都具有虛擬記憶體和快速文件系統,所以不再需要這種技術

SVR4和4.3+BSD中粘住位主要針對目錄,在目錄設置了粘住位之後,對該目錄具有寫許可權的用戶在滿足下列情況之一的情況下才可以刪除或重命名目錄下的文件:擁有文件/擁有目錄/超級用戶

umask函數:

用於設置和進程相關的文件方式創建屏蔽字。在進程創建文件的時候就會根據文件方式創建屏蔽字以及創建時指定的許可權為文件設置讀寫許可權。

文件方式創建屏蔽字為1的位,無論創建時指定的許可權位為0/1都會將對應的許可權位設置為0

st_uid/st_gid

新文件的用戶/組ID:

在創建新文件、目錄的時候,新文件的用戶ID為創建進程的有效用戶ID

POSIX規定,組ID可以通過下麵兩種方式之一確定:

  • 進程的有效組ID
  • 所在目錄的組ID

SVR4系統中,如果文件的設置組ID位被設置,那麼新文件的組ID為所在目錄的組ID,否則為進程的有效組ID

4.3+BSD系統中始終使用所在目錄的組ID

access函數:

驗證實際用戶對文件的存取許可權

以文件路徑的方式指定需檢查的文件,第二個參數指定需要檢查的項

  • R_OK 測試讀許可權
  • W_OK 測試寫許可權
  • X_OK 測試執行許可權
  • F_OK 測試文件是否存在

chown/fchown/lchown函數:

用於更改文件的用戶ID和組ID

符號鏈接:lchown更改符號鏈接本身的所有者,其他兩個更改符號鏈接指向的文件的所有者

只有SVR4支持lchown,在非SVR4系統中,如果chown的參數是符號鏈接就改變其本身的所有者,如果想要改變其指向的文件,就需要直接指定該文件

POSIX.1規定按照_POSIX_CHOWN_RESTRICTED的值設置更改文件所有者是否受限

若起作用,則:

  • 只有超級用戶才能改變文件的用戶ID
  • 在下列情況下非超級用戶可以改變文件的組ID
    • 進程的有效用戶ID為文件的用戶ID
    • 參數owner等於文件的用戶ID,參數group等於進程的有效組ID或者進程的添加組ID

函數在被非超級用戶調用併成功返回後文件的設置-用戶ID和設置-組ID被清除

st_size

指明文件長度,只對普通文件、符號連接、目錄文件起作用。SVR4支持對管道表示管道中可讀取的位元組數

符號鏈接的長度表示其指向文件名的位元組數,因有長度指定,所以不以null結尾

普通文件的長度可以為0,但是目錄和符號連接不會為0。因為目錄至少包含"."和".."兩項,符號連接的文件內容是文件路徑,文件路徑至少有一個字元

SVR4和4.3+BSD支持使用st_blksize和st_blocks表示塊大小和塊數

文件空洞:偏移量超過文件結尾進行寫數據,文件結尾和新寫的數據之間就是文件空洞。

文件空洞不會用實際的空間存儲,所以st_size要比st_blksize*block得到的大(即便除去額外的維護所需空間)。使用read()函數讀取得到的是0。

但是如果使用如cat(1)進行文件複製,會將空洞複製為實際的位元組0而占用實際的存儲空間

文件截短:

使用truncate和ftruncate將文件截短至指定的長度

對於文件長度大於截斷長度的,截斷長度之後的內容無法讀取

對於文件長度小於截斷長度的,根據實際實現的系統而定

st_atime/st_mtime/st_ctime

每個文件都有三個時間:

  • st_atime:文件數據的最後存取時間
  • st_mtime:文件數據的最後修改時間
  • st_ctime:i節點狀態的最後修改時間

utime函數用於更改一個文件的存取和修改時間

參數需傳遞一個包含兩個時間的結構體

  • 結構體為null:將存取時間和修改時間設置為當前時間。需要滿足進程的有效用戶ID為文件的所有者ID或者進程對該文件有寫許可權
  • 結構體不為null:將存取時間和修改時間設置為指定的值。需要滿足進程的有效用戶ID為文件的所有者ID或者進程是超級用戶進程

不能修改修改狀態時間(st_ctime)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 小弟初來乍到,分享一些工作學習中遇到的問題和解決方式,如有不准確或是有錯誤的地方,希望不吝賜教,謝過了。 --Dogtwo 背景: 一個代理伺服器BK,接收前端A發送的請求,記錄log,並轉發給另外的伺服器B。 請求中有類似這樣的模塊: Person: { name:abc, age: 20, ad ...
  • [HttpGet] public ActionResult JsonList() { int itemselect = ConvertHelper.SafeRequest("itemselect",0);//一級 int ProfessionID = ConvertHelper.SafeReques ...
  • 一 鏡像基本操作 鏡像是一個包含程式運行必要依賴環境和代碼的只讀文件,其本質是磁碟上一系列文件的集合。它採用分層的文件系統,將每一次改變以讀寫層的形式增加到原來的只讀文件上。鏡像是容器運行的基石。 1.1 搜索鏡像 docker命令必須具備root許可權,普通用戶可是用那個sudo。 提示:docke ...
  • 本書是由全國多名紅帽架構師(RHCA)基於最新Linux系統共同編寫的高質量Linux技術自學教程,極其適合用於Linux技術入門教程或講課輔助教材,目前是國內最值得去讀的Linux教材,也是最有價值的Linux實驗手冊。 章節包括有: 第0章 咱們先來談談學習方法和紅帽系統。 第1章 部署虛擬環境 ...
  • NFS配置文件許可權參數說明(/etc/exports) 1、rw :表示可讀寫許可權。 2、ro :表示只讀許可權。 3、sync :請求或寫入數據時,數據同步寫入到NFS Server的硬碟後才返回。(優點:數據安全不會丟。缺點:性能比啟用該參數要差)。 4、async :寫入時數據會先寫到記憶體緩衝區 ...
  • 一 Heartbeat簡介 1.1 概述 Heartbeat是Linux-HA項目中的一個組件,也是當前開源HA項目中最成功的一個例子,它提供了所有HA軟體所需要的基本功能,如心跳檢測和資源接管、監測群集中的系統服務、在群集中的節點間轉移共用IP地址的所有者等。heartbeat最核心的功能包括兩個 ...
  • firewalld 是一種動態防火牆管理解決方案。Centos 7 預設使用 firewalld。firewalld 是對 iptables 的一個封裝,可以讓你更容易地管理 iptables 規則。它並不是 iptables 的替代品,雖然 iptables 命令仍可用於 firewalld,但建... ...
  • Apache伺服器可以配置多個虛擬主機,從而為多個站點提供服務,其實質就是根據不同的策略,訪問不同的文件系統目錄。apache提供3種虛擬主機的策略,1.基於埠的虛擬主機;2.基於功能變數名稱的虛擬主機;3.基於IP的虛擬主機。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...