基本概念 塊設備(blockdevice) 是一種具有一定結構的隨機存取設備,對這種設備的讀寫是按塊進行的,他使用緩衝區來存放暫時的數據,待條件成熟後,從緩存一次性寫入設備或者從設備一次性讀到緩衝區。 字元設備(Character device) 是一個順序的數據流設備,對這種設備的讀寫是按字元進行 ...
基本概念
塊設備(blockdevice)
--- 是一種具有一定結構的隨機存取設備,對這種設備的讀寫是按塊進行的,他使用緩衝區來存放暫時的數據,待條件成熟後,從緩存一次性寫入設備或者從設備一次性讀到緩衝區。
字元設備(Character device)
---是一個順序的數據流設備,對這種設備的讀寫是按字元進行的,而且這些字元是連續地形成一個數據流。他不具備緩衝區,所以對這種設備的讀寫是實時的。
扇區(Sectors):任何塊設備硬體對數據處理的基本單位。通常,1個扇區的大小為512byte。(對設備而言)
塊 (Blocks):由Linux制定對內核或文件系統等數據處理的基本單位。通常,1個塊由1個或多個扇區組成。(對Linux操作系統而言)
段(Segments):由若幹個相鄰的塊組成。是Linux記憶體管理機制中一個記憶體頁或者記憶體頁的一部分。
頁、段、塊、扇區之間的關係圖如下:
塊設備驅動整體框架
塊設備的應用在Linux中是一個完整的子系統。
塊設備驅動:在Linux中,驅動對塊設備的輸入或輸出(I/O)操作,都會向塊設備發出一個請求,在驅動中用request結構體描述。但對於一些磁碟設備而言請求的速度很慢,這時候內核就提供一種隊列的機制把這些I/O請求添加到隊列中(即:請求隊列),在驅動中用request_queue結構體描述。在向塊設備提交這些請求前內核會先執行請求的合併和排序預操作,以提高訪問的效率,然後再由內核中的I/O調度程式子系統來負責提交 I/O 請求,調度程式將磁碟資源分配給系統中所有掛起的塊 I/O 請求,其工作是管理塊設備的請求隊列,決定隊列中的請求的排列順序以及什麼時候派發請求到設備。
通用塊層(Generic Block Layer):負責維持一個I/O請求在上層文件系統與底層物理磁碟之間的關係。在通用塊層中,通常用一個bio結構體來對應一個I/O請求。
Linux提供了一個gendisk數據結構體,用來表示一個獨立的磁碟設備或分區,用於對底層物理磁碟進行訪問。在gendisk中有一個類似字元設備中file_operations的硬體操作結構指針,是block_device_operations結構體。
IO調度層:當多個請求提交給塊設備時,執行效率依賴於請求的順序。如果所有的請求是同一個方向(如:寫數據),執行效率是最大的。內核在調用塊設備驅動程式常式處理請求之前,先收集I/O請求並將請求排序,然後,將連續扇區操作的多個請求進行合併以提高執行效率(內核演算法會自己做,不用你管),對I/O請求排序的演算法稱為電梯演算法(elevator algorithm)。電梯演算法在I/O調度層完成。內核提供了不同類型的電梯演算法,電梯演算法有
1 noop(實現簡單的FIFO,基本的直接合併與排序),
2 anticipatory(延遲I/O請求,進行臨界區的優化排序),
3
Deadline(針對anticipatory缺點進行改善,降低延遲時間),
4 Cfq(均勻分配I/O帶寬,公平機制)
PS:其實IO調度層(包括請求合併排序演算法)是不需要用戶管的,內核已經做好。
映射層(Mapping Layer):起映射作用,將文件訪問映射為設備的訪問。
VFS:對各種文件系統進行統一封裝,為用戶程式訪問文件提供統一的介面,包含ext2,FAT,NFS,設備文件。
磁碟緩存(Caches):將訪問頻率很高的文件放入其中。
相關數據結構
block_device: 描述一個分區或整個磁碟對內核的一個塊設備實例
gendisk:
描述一個通用硬碟(generic hard disk)對象。
hd_struct: 描述分區應有的分區信息
bio:
描述塊數據傳送時怎樣完成填充或讀取塊給driver
request: 描述向內核請求一個列表準備做隊列處理。
request_queue: 描述內核申請request資源建立請求鏈表並填寫BIO形成隊列。