文件系統是一種存儲和組織電腦數據的方法,它使得對電腦的訪問和查找變得容易,文件系統使用文件和樹形目錄的抽象邏輯概念代替了硬碟和光碟等物理設備使用數據塊的概念,用戶使用文件系統來保存數據不必關心數據實際保存在硬碟(或者光碟)的地址為多少的數據塊上,只需要記住這個文件所屬目錄和文件名。在寫入新數據之... ...
文件系統概念引入
文件系統是一種存儲和組織電腦數據的方法,它使得對電腦的訪問和查找變得容易,文件系統使用文件和樹形目錄的抽象邏輯概念代替了硬碟和光碟等物理設備使用數據塊的概念,用戶使用文件系統來保存數據不必關心數據實際保存在硬碟(或者光碟)的地址為多少的數據塊上,只需要記住這個文件所屬目錄和文件名。在寫入新數據之前,用戶不必關心硬碟上的那個地址有沒有被使用,硬碟上的存儲空間管理(分配和釋放)功能由文件系統自動完成,用戶只需要記住數據被寫到了哪個文件中。
我們都知道磁碟分區後還要進行格式化,之後操作系統才能夠使用這個分區。這是因為每種操作系統所設置的文件屬性/許可權不同,為了存放這些數據所需要的空間,因此就要對分區進行格式化,以便成為操作系統能夠利用的文件系統格式。
文件數據除了文件的實際內容外,還含有文件許可權(RWX)與文件屬性(所有者、群組、時間參數等)。文件系統通常會把這兩部分數據放到不同的塊中,許可權與屬性放置到inode中,至於實際數據則放置到data-block中。另外,還有一個Superblock會記錄文件的整體信息,包括inode與block的總量、使用量’剩餘量等。
每個inode和block都有編號,這三個數據的意義簡要的說明如下:
- superblock:記錄文件的整體信息,包括inode/block的總量、使用量、剩餘量,以及文件系統的格式與相關信息等;
- inode:記錄文件屬性,一個文件占用一個inode,同時記錄此文件的數據所在的blick號碼;
- block:實際記錄文件的內容,若文件太大,會占用多個block。
由於inode和block都有自己的編號,而每個文件都會占有一個inode,inode內則含有文件數據放置的block號碼。所以,如果能找到文件的inode,那麼自然就會知道數據存放到哪些block了,也可以對數據進行讀取。
inode/block數據訪問示意圖
如圖所示,文件系統先格式化出 inode 與 block的區塊,假設一個文件的許可權和屬性是放在4號(白色方塊),而這個 inode 記錄了文件數據的實際的放置點為2,7,13,15這4個號碼,此時我們就可以一次找到這4個block的內容!
這種數據訪問的方式稱為索引式文件系統(indexed allocation)。至於我們常用的U盤,使用的一般是FAT格式,這種格式的文件系統沒有 inode 存在,所以每個block號碼都記錄在前一個block當中,如圖所示:
我們經常聽到“碎片整理”對吧,需要碎片整理的原因就是文件寫入的 block 太過於離散了,此時文件讀取的性能將會變得很差所致。這個時候可以通過碎片整理將一個文件所屬的block匯合在一起,讀取比較容易,一般來說,Ext2不太需要經常進行碎片整理,使用太久的話,也許需要。
EXT2文件系統
Linux的正規文件系統為Ext2 。文件系統一開始就將inode與block規劃好了,除非重新格式化(後者利用resize2fs等命令更改文件),否則inode與block固定後就不再變動。但是如果我們的文件系統高達幾百GB時,把所有的inode和block放在一起是很不明智的。
因此Ext2在格式化的時候基本上是分為多個塊組(block group)的,每個塊組都有獨立的inode/block/superblock系統。在整體的規劃當中,**文件系統最前面有一個活動扇區(boot sector), 這個啟動扇區可以安裝引導裝載程式,**這樣我們就能夠將不同的引導裝載程式安裝到個別的文件系統最前端,而不用覆蓋整塊硬碟的唯一MBR。
data block(數據塊)
data block是用來放置文件內容的地方,**在Ext2文件系統中所支持的block大小有1kb、2kb以及4kb三種。**在格式化時,block的大小就固定了,且每個block都有編號,以便inode記錄。由於block大小的差異,會導致該文件系統能夠支持的最大磁碟容量與最大單一文件容量並不相同。如下表格所示:
Block大小 | 1KB | 2KB | 4KB |
---|---|---|---|
最大單一文件限制 | 16GB | 256GB | 2TB |
最大文件系統容量 | 2TB | 8TB | 16TB |
除此之外,Ext2文件系統的block還有哪些限制?
- 原則上,block的大小與數量在格式化完就不能再改變了(除非重新格式化)
- 每個block內最多只能夠放置一個文件的數據
- 如果文件大於block的大小,則就會占用多個block
- 若文件小於block,則該block的剩餘容量就不會被使用(磁碟空間浪費)
例題:
假設你的Ext2文件系統使用4K block,而改文件系統中有10000個小文件,每個文件的大小均為50 bytes,請問此時磁碟浪費多少容量?由於一個block只能容納一個文件,所以,每個block會浪費4046 bytes,所有文件僅為:50 x 10000(bytes) = 488.3KB,但浪費卻達到了:4046 x 10000(bytes) = 38.6MB。所以合適的block大小很重要。
inodetable(inode表格)
前面已經說了,inode的內容主要記錄文件的屬性以及該文件實際數據的位置。基本上,它記錄的文件數據有下麵這些:
- 該文件的訪問模式(read/write/execute)
- 該文件的所有者與組(owner/group)
- 該文件的大小的各個時間(ctime/atime/mtime)
- 定義文件特征的標誌(flag),如SUID等
- 該文件真正內容的指向(pointer)
- 每個inode大小固定為128bytes
- 每個文件都僅會占用一個inode
**因此文件系統能創建的文件數量與inode的數量有關。系統讀取文件時需要找到inode,並分析inode所記錄的許可權與用戶是否符合,若符合才能夠開始實際讀取block的內容。下麵我們來簡單分析下inode/block與文件大小的關係。inode要記錄的數據非常多,但是又只有128bytes,一個block占用4bytes。那如果我們的文件比較大,該怎麼辦?為此我們的系統將inode記錄block號碼的區域定義為12個直接、一個間接、一個雙間接、一個三間接記錄區。**如圖所示:
以每個block的大小1KB為例來說,情況如下:
- 12個直接指向:12 x 1K = 12K
- 間接:256 x 1K = 256K
- 雙間接:256 x 256 x 1K = 2562K
- 三間接:256 x 256 x 256 = 256 3K
總額:將上面的加在一起,可得到12 + 256 + 2562 + 2563(K) = 16GB.我們這下也知道了前面的最大單一文件限制是怎麼來的了。
superblock(超級塊)
superblock主要是記錄整個文件系統相關的地方,記錄的主要信息有:
- block與inode的總量,未使用和已使用的inode/block數量及總量
- block與inode的大小
- 文件系統掛載時間、最近一次寫入數據的時間、最近一次檢驗磁碟(fsck)時間等
- 一個valid bit數值,若此文件系統已經被掛載,則valid bit為0,否則為1
File system description(文件系統描述說明)
這個區段可以描述每個block group的開始與結束的號碼,以及說明每個區段(superblock、bitmap、inodemap、data block)分別介於哪個block號碼之間。也能夠用dumpe2fs查看。
block bitmap(塊對照表)
我們可以通過block bitmap來知道哪些block是空的,此時系統就可以快速地找到可使用空間老放置文件。
inode bitmap(inode對照表)
這個和block bitmap的功能是類似的,只是inode bitmap記錄的是使用與未使用的號碼。
本文來自博客園,作者:古道輕風,轉載請註明原文鏈接:https://www.cnblogs.com/88223100/p/EXT2_EXT3_FileSystem.html