文件系統(四):FAT32文件系統實現原理

来源:https://www.cnblogs.com/liwen01/p/18204782
-Advertisement-
Play Games

FAT32是從FAT12、FAT16發展而來,目前主要應用在移動存儲設備中,比如SD卡、TF卡。隱藏的FAT文件系統現在也有被大量使用在UEFI啟動分區中。 為使文章簡單易讀,下麵內容特意隱藏了很多實現細節,關於分區、格式化等相關的內容,可以查看之前的文章: 文件系統(一):存儲介質、原理與架構 文 ...


FAT32是從FAT12、FAT16發展而來,目前主要應用在移動存儲設備中,比如SD卡、TF卡。隱藏的FAT文件系統現在也有被大量使用在UEFI啟動分區中。

為使文章簡單易讀,下麵內容特意隱藏了很多實現細節,關於分區、格式化等相關的內容,可以查看之前的文章:

文件系統(一):存儲介質、原理與架構

文件系統(二):分區、格式化數據結構

文件系統(三):嵌入式、電腦系統啟動流程與步驟

(一)FAT32 磁碟佈局

拿一個FAT32文件系統的存儲設備,我們可以看到,它整個存儲設備大概可以分為5個部分:引導、保留扇區、FAT表、目錄和文件、備份

(1)引導與保留扇區

引導和保留扇區部分,會因為分區方式的不同(MBR與GPT)而不同,同時也會因為存儲設備分區個數的不同也會有差異。

下麵這個是使用GPT方式將存儲設備分為1個分區並格式化為FAT32文件系統格式的數據分佈示意圖。

(2)備份

在磁碟末尾的備份區域,主要是使用GPT方式分區的時候,會將分區表信息備份到存儲設備的最後區域。對於MBR分區方式,並沒有這部分。

(3)FAT表與目錄項

在FAT32文件系統的使用過程中,FAT表和目錄項是其核心部分,將在下麵介紹

(二)文件在哪裡?

將一個存儲設備格式化成FAT32格式文件系統,然後再在上面創建幾個文件夾和文件,那麼這些文件和文件夾的名字信息是存儲在什麼位置?文件裡面的數據又是存儲在哪?要怎樣才能找到這些文件?

上面在一個TF卡中創建了test1、test2、test3、test4 四個文件夾和一個0000.media媒體文件。

System Volume Information 目錄及其下麵的文件是在Windows系統格式化的時候系統寫入的系統文件。

目錄項

FAT表後面的區域,是根目錄的存儲區域,目錄和文件以及文件中的實際數據都存儲在這個一個大的區域。根目錄是在該區域最開始的位置。

從根文件所在扇區的數據我們可以看到根目錄的目錄項信息:

WinHex工具上,根目錄所在位置的還有4個“新建文件夾”項。這個是因為在Windows創建文件夾的時候,開始的名字是“新建文件夾”,後面被我重命名成了test1~4

目錄項分為長文件名短文件名

如果一個文件它的名字大於11個位元組,那它就至少有兩個目錄項,一個短文件名項和一個長文件名項。

文件名長度小於等於11個位元組的話,就只有一個短文件名項。短文件名目錄項長度為32個位元組,各位元組的定義如下:

根據上面定義可以對根目錄下的目錄項進行解析:

以test2目錄項舉例,我們可以看到:

  • 文件名為test2 (短文件名)
  • 文件屬性為10 (子目錄 )
  • 這裡時間需要轉換,2位元組用不同的位表示年月日和時分秒
  • 起始簇號為07

如果目錄項是以E5開頭,那表示該項是無效的或是已經刪除了的目錄項,比如上面的四個"新建文件夾"目錄項

通過目錄項,我們可以知道存儲設備上都有哪些文件和目錄,相應的子目錄也是一樣的實現,只不過子目錄下麵的目錄項是在子目錄所在的簇中記錄。

(三)文件磁碟空間分配

在FAT32文件系統中,它是以簇為單位進行空間分配和管理。一般一個簇的大小為4KB(下麵均以4KB做參考)。

一個文件或是一個目錄,它是通過目錄項知道它在存儲設備上存放的的開始位置,也就是開始簇號,而簇號信息,是存儲在FAT表上,

一個FAT32文件系統有兩個FAT表,一個正常使用,另外一個為備份FAT表

通過分區上的DBR和FSINFO信息可以知道FAT表的大小和所在位置等信息。

FAT32 是以32位(4Byte)來定義一個FAT表項,也就是一個簇的狀態,下表是FAT表項中值的含義:

對於FAT表,第0號簇是固定的0x0FFFFFF8,第1號簇項0xFFFFFFFF是被系統使用

第3號簇是根目錄的開始簇,如果其值是0x0FFFFFFF,表示根目錄只占用一個簇的空間,也就是4KB大小空間,如果其值是0x00000002~0x0FFFFFFE,表示根目錄的下一個簇號,直到出現文件結束簇0x0FFFFFFF,也就是根目錄大於4KB的大小。

下麵是對FAT表現的一個解析。

從上面可以看出:

  1. 如果文件或是目錄小於4K(一個簇),那它所占用的空間就是目錄項中起始簇號所分配的空間,該簇號的值為結束簇號的值(0x0FFFFFFF)
  2. 如果一個文件大於4K(一個簇),目錄項中的起始簇號所在位置的值,就是下一個位置存儲的簇號值,比如0000.media 文件,它的起始簇號是10,第10簇號(0x0000000B)->第11簇號(0x0000000C)->......第241簇號(0x0x00000F2)->第242簇號(0x0FFFFFFF 結束簇號)
  3. 上面這個0000.media文件是以連續的方式存儲在磁碟中,當磁碟滿了或是使用久了之後,會存在磁碟碎片,有可能就不是連續的空間了。

(四)實現原理

我們從文件的創建、數據寫入、文件刪除等操作流程看文件系統的基本實現原理

(1)文件創建

  1. 創建文件或是目錄的時候,會先在當前目錄所在位置的目錄項中添加一個目錄項
  2. 目錄項會記錄文件的起始簇號,創建、修改時間,文件屬性等信息

(2)文件增刪數據

  1. 如果起始簇空間寫滿了,系統會查找一個空閑簇,數據將繼續寫入到該空閑簇中,FAT表中該空閑簇會被標記已經被使用,同時,該文件的結束簇號也會往後移動一個簇。
  2. 更新該目錄項中的修改時間、文件大小等信息
  3. 刪除或是修改文件裡面的數據,就是一個反向的過程

(3)文件數據讀取

  1. 通過目錄項,找需要讀取文件所在的開始簇位置
  2. 如果文件大於一個簇,開始簇位置的值為下一個簇的位置,可以順著這個簇鏈一直查找,直到結束簇出現。

(4)文件刪除

  1. 文件刪除的時候,根目錄中該目錄項的信息並不會被刪除,而是將該目錄項標記為刪除狀態
  2. FAT表中該文件所占用的簇號,會被標記為0,表示該簇為未使用的簇。
  3. 該文件所在簇號所對應扇區的實際文件數據不會被擦除,文件裡面的數據還是存儲在刪除上。

文件刪除,實際上也就是將該文件在FAT表中的簇信息標記為可使用,然後將目錄項標記為已刪除,實際數據不會做刪除處理

如果要恢復被刪除的文件,可以根據目錄項中的信息進行恢復,前提是不要再創建新文件和寫入新數據,因為新的數據容易將原來文件所在扇區的數據覆蓋或是擦除。

(5)基本原理

FAT32文件系統的基本原理,是通過目錄項來管理磁碟的文件目錄結構,然後通過FAT表來管理磁碟文件所使用的簇(扇區)空間。

FAT32 文件系統的FAT表是通過單向鏈式的方法來管理扇區,這種方式在小文件和小容量的儲存設備上使用比較方便,但不適合於大文件和大容量的存儲設備。

目前大於32GB的SDXC卡,SD協會已採用exFAT作為預設的文件系統。

(五)優缺點

(1)優點

FAT32 文件系統現在還在被大量使用,其主要的優勢在於:相容性強和實現簡單

相容性強: 它可以同時支持Windows、Linux、Mac OS 三個操作系統,同時因為它的歷史悠久,很早就已經被廣泛使用,所以很多老舊電腦系統和設備都可以支持。

實現簡單: 它的設計相對簡單、易於實現和維護,特別是在系統資源緊張的嵌入式設備中。

(2)缺點

它的缺點主要有:不適合大文件、磁碟碎片化、安全性較差

不適合大文件

目錄項中使用4個位元組表示文件大小,其最大表示的值為4GB,所以FAT32對於單個文件的最大大小限製為4GB。

安全性較差:

相比一些現代文件系統(如NTFS、exFAT等),FAT32的安全性較差。它缺乏對文件和文件夾的訪問控制、加密、日誌記錄等高級功能,因此不適合用於存儲敏感數據或需要更高安全性的場景。

(3)磁碟碎片化

磁碟碎片化這裡描述詳細一些,因為它會影響到文件系統的性能。

靜態分配簇

FAT32使用固定大小的簇(cluster)來管理存儲空間。每個文件都被分配到一個或多個簇來存儲,這些簇在存儲設備上連續地排列。當文件大小超過一個簇的容量時,系統會分配額外的簇給文件。但是,如果在磁碟上沒有足夠的連續空閑簇來容納整個文件,文件就會被分割成多個片段並存儲在不同的地方,導致碎片化。

文件刪除和大小改變

FAT32文件系統的碎片化還會因為文件的刪除和大小的改變而產生。當文件被刪除時,它占用的簇會被標記為空閑,可以被其他文件使用。如果其他文件需要的空間無法與原文件的簇連續,新文件就會分配到磁碟上的不同位置,造成碎片化。同樣地,當文件的大小發生改變時,如果新的大小需要的簇數超過了原文件所占用的連續簇數,文件也會發生碎片化。

碎片化的影響

碎片化會影響文件的讀取和寫入性能。當文件被分割成多個片段時,系統需要花費更多的時間來定位和讀取這些片段,從而降低了文件的讀取速度。另外,由於文件存儲不連續,存儲設備上可能會出現許多小的空閑碎片,導致存儲空間的浪費。

結尾

上面內容是以比較概況的方式來介紹FAT32文件系統的實現原理和它的優缺點,至於FAT32文件系統的詳細實現細節,可以通過官方文檔進行瞭解(晦澀難懂),也可以找張TF卡,通過winhex等工具,自己動手查看它的實現細節。

 

---------------------------End---------------------------
如需獲取更多內容
請關註 liwen01 公眾號

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • efcore如何優雅的實現按年分庫按月分表 介紹 本文ShardinfCore版本 本期主角: ShardingCore 一款ef-core下高性能、輕量級針對分表分庫讀寫分離的解決方案,具有零依賴、零學習成本、零業務代碼入侵適配 距離上次發文.net相關的已經有很久了,期間一直在從事java相關的 ...
  • Channel 是乾什麼的 The System.Threading.Channels namespace provides a set of synchronization data structures for passing data between producers and consume ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • 歡迎ReaLTaiizor是一個用戶友好的、以設計為中心的.NET WinForms項目控制項庫,包含廣泛的組件。您可以使用不同的主題選項對項目進行個性化設置,並自定義用戶控制項,以使您的應用程式更加專業。 項目地址:https://github.com/Taiizor/ReaLTaiizor 步驟1: ...
  • 前言 插件化的需求主要源於對軟體架構靈活性的追求,特別是在開發大型、複雜或需要不斷更新的軟體系統時,插件化可以提高軟體系統的可擴展性、可定製性、隔離性、安全性、可維護性、模塊化、易於升級和更新以及支持第三方開發等方面的能力,從而滿足不斷變化的業務需求和技術挑戰。 一、插件化探索 在WPF中我們想要開 ...
  • tc(Traffic Control)是 Linux 中用於流量控制和網路模擬的強大工具。你可以使用它來模擬網路延遲、帶寬限制、數據包丟失等。 以下是一個使用 tc 模擬網路延遲的基本步驟: 1.查看當前的 qdisc(隊列規則)和 filter(過濾器) 首先,確保你的網路介面沒有設置任何 qdi ...
  • 一:Pod介紹 pod資源的各種配置和原理 關於很多yaml文件的編寫,都是基於配置引出來的 1:pod的結構和定義 每個Pod中都可以包含一個或者多個容器,這些容器可以分為2大類: 1:用戶所在的容器,數量可多可少(用戶容器) 2:pause容器,這是每個pod都會有的一個跟容器,作用有2個 1、 ...
  • 記錄一下 今天突然發現之前的小米妙享用不了 百度了一下才知道澎湃上線後 這玩意兒好像就沒用了; 所以找了一圈替代品,發現了小米電腦管家這個東西內置了HyperConnect跨端智聯,但是這玩意兒又不能直接安裝,又找了一圈怎麼安裝; 原文鏈接:非小米電腦安裝小米電腦管家-雪餅 (xue6ing.cn) ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...