硬鏈接(Hard Link)和軟鏈接也稱為符號鏈接(Symbolic Link)的目的是為瞭解決文件的共用使用問題。要闡明其原理,必須先理解Linux的文件存儲方式。 索引結點 Linux是一個UNIX類操作系統,所有類型的UNIX文件都是由操作系統通過索引節點來管理的。 索引節點是一個控制結構,包 ...
硬鏈接(Hard Link)和軟鏈接也稱為符號鏈接(Symbolic Link)的目的是為瞭解決文件的共用使用問題。要闡明其原理,必須先理解Linux的文件存儲方式。
索引結點
Linux是一個UNIX類操作系統,所有類型的UNIX文件都是由操作系統通過索引節點來管理的。
索引節點是一個控制結構,包含操作系統所需的關於某個文件的關鍵信息。多個文件名能與一個索引節點相關聯,但一個活躍的索引節點只能與一個文件相關聯,且每個文件只能由一個索引節點來控制。文件的屬性、訪問許可權和其他控制信息都保存在索引節點中。此處以Linux中ext2的索引結點示例。
Ext2文件系統的每一個文件和目錄都對應一個索引結點,每一個數據塊組中的索引結點都保存在索引結點表中。
ext2的索引結點的一些主要欄位:
Mode:包含次索引結點描述的是什麼(比如描述文件、目錄、符號鏈接、塊設備、字元設備以及FIFO結構等)以及用戶擁有的許可權
Owner information:文件或目錄所有者的用戶和組標識符,這使得文件系統可以正確地授權某種存取操作
Size:文件大小
Timestamps:建立時間和最後修改時間
Datablocks:指向存儲此索引結點描述的文件數據塊的指針。直接指針指向存儲數據的物理數據塊,間接指針、兩級指針和三級指針指向不同級別的指針塊或數據。
具體的索引節點結構會因為UNIX實現的不同而發生變化,再舉一個FreeBSD的索引節點結構:
當訪問一個文件時,通過文件名在目錄表中查找到其索引節點號,通過索引節點號查索引節點表得到其索引節點,通過索引節點得到文件數據所在的位置。
索引結點也會消耗硬碟空間,所以硬碟格式化的時候,操作系統自動將硬碟分成兩個區域。一個是數據區,存放文件數據(data block);另一個是索引結點區(inode table),存放索引結點所包含的信息。
每個索引結點的大小,一般是128位元組或256位元組。索引結點的總數,在格式化時就給定,一般是每1KB或每2KB就設置一個索引結點。
Linux中的相關命令:
查看每個硬碟分區的索引結點總數和已經使用的數量,可使用df命令:df -
查看每個索引結點節點的大小,可以用如下命令:sudo dumpe2fs -h /dev/hda | grep “Inode size”
使用ls –l命令會顯示出在大部分信息. ls –i option顯示文件的索引號.
而stat命令則可以列出索引節點中的幾乎所有信息.
文件系統第一次被創建時, 會為每一個文件系統創建若幹數量的索引節點。該數目是文件系統所能容納的最大文件數。只要不重新初始化文件系統, 就不能改變這個數目, 否則會損壞該文件系統上所有的數據。當文件系統中有很多很多小文件時文件系統會可能將索引節點全部用光。
一個文件系統維護了一個索引節點的數組,每個文件或目錄都與索引節點數組中的唯一一個元素對應。系統給每個索引節點分配了一個號碼,也就是該節點在數組中的索引號,稱為索引節點號。操作系統用索引結點號碼來識別不同的文件。
錶面上,用戶通過文件名,打開文件。實際上,系統內部這個過程分成三步:首先,系統找到這個文件名對應的索引結點號碼;其次,通過索引結點號碼,獲取索引結點信息;最後,根據索引結點信息,找到文件數據所在的block,讀出數據。
使用ls -i命令,可以看到文件名對應的inode號碼:ls -i example.txt
由於索引結點與文件名分離,這種機制導致了一些Unix/Linux系統特有的操作
1. 若出現文件名包含特殊字元,無法正常刪除的情況。這時,可以通過直接刪除索引結點來刪除文件。
2. 移動文件或重命名文件,只是改變文件名,不影響索引結點號碼。
3. 打開一個文件以後,系統就以索引結點號碼來識別這個文件,不再考慮文件名。因此,通常來說,系統無法從索引結點號碼得知文件名。
第3點使得軟體更新變得簡單,可以在不關閉軟體的情況下進行更新,不需要重啟。更新的時候,新版文件以同樣的文件名,生成一個新的索引結點,不會影響到運行中的文件。等到下一次運行這個軟體的時候,文件名就自動指向新版文件,舊版文件的索引結點則被回收。
硬鏈接和軟連接
基於索引結點共用:硬鏈接(hard link)
文件索引節點中設有一個鏈接計數欄位inode link count,用來表示連接到本索引結點上的用戶目錄項的數目
用戶A創建一個新文件時,inode link count;
用戶B要共用該文件,B的目錄中增加一個目錄項,並填上新的文件名和指向該共用文件的索引結點的指針,inode link count;
缺點:文件主無法刪除被他人共用的文件。
•在系統中占用的空間與源文件相同,但在系統中引用的是相同的對象(不是拷貝)
•在操作系統層解析
•圖標和創建快捷方式的圖標不同
•移除源文件不會影響硬鏈接
•移除硬鏈接不會影響源文件
•如果源文件被刪除,它的內容依然通過硬鏈接存在
•硬鏈接文件的任何更改都會影響到源文件
$ln a b # b是a所指文件的硬鏈接
硬鏈接實際上是為原文件建立一個別名,鏈接文件和原文件實際上是同一個文件。可以通過ls -i來查看。兩個文件的inode號是同一個,說明它們是同一個文件。它只是在文件原來的inode link count域再增加1而已,也因此硬鏈接是不可以跨文件系統的。硬鏈接刪除的時候,系統調用會檢查inode link count的數值,如果它大於等於1,那麼inode不會被回收,因此文件的內容不會被刪除。目錄不能進行硬連接。目錄硬連接引用計數,如果形成環,刪除的時候會產生dangling dir。
基於文件路徑共用:符號鏈接(symbolic link)&軟連接(junction link or soft link)
為了能使B共用A的一個文件,系統為B建立一個類型為link的新文件,將該文件放在B的目錄下,在新文件中只包含了目標文件的路徑名,當B讀該link類型的文件時,將被OS截獲,並根據新文件中的路徑名去讀目標文件。這種實現文件共用的方式成為符號鏈接。
在這種方式下,文件主刪除被他人共用的文件後,其他用戶再去訪問該共用文件,會因找不到文件而失敗,再將該符號鏈刪除不會造成任何影響
缺點:其他用戶訪問共用我共用文件時,必鬚根據路徑中的分量名逐級檢索目錄,加大了訪問文件的開銷;儘管Link類型文件很簡單,但任需為它配置一個索引結點,並分配一個盤塊來存放目標文件的路徑名,這樣也增加了系統的開銷。
•創建鏈接後的圖標和快捷方式很像
•在系統中不占用空間
•在文件系統中不是一個單獨的文件
•在操作系統層解析
•如果源文件被刪除了,鏈接就沒用了
•移除源文件不會影響符號鏈接
•移除鏈接文件也不會影響源文件
$ ln –s a b #為a創建一個符號鏈接b
rm b:a不受影響
rm a:a不存在,b能被控制但無法訪問
軟鏈接實質是新建立一個inode,產生一個新的文件,但這個文件的作用就是專門指向某個文件的,刪除這個軟鏈接文件,原來的實體原文件還是存在的,保持不變。但要是刪除原來的文件,則相應的軟鏈接不可用(cat那個軟鏈接文件,則提示“沒有該文件或目錄”)。符號鏈接可以跨文件系統,可以跨磁碟分區,符號鏈接的文件類型位是l。
比較
硬鏈接
1.只允許文件鏈接,不允許目錄鏈接;
2.只能在同一個文件系統範圍內進行,不允許跨文件系統。
3.刪除文件時,如果還有其他鏈接鏈至該文件,則該文件不能被刪除。
軟鏈接
1.訪問速度相對較慢,但適用範圍和靈活性更大。
2.允許目錄鏈接,允許在不同的文件系統間進行鏈接,這兩個文件系統可以在同一個電腦上,也可以在不同的電腦上。
3.被鏈接文件的刪除和符號鏈接的刪除是完全獨立的
資料出處
1. 操作系統第八版
2. 操作系統原理、設計及應用。高等教育出版社
3. 電子科技大學電腦學院蒲曉蓉老師操作系統課件
4. 電子科技大學電腦學院薛瑞尼老師操作系統課件