目錄系統IO介面說明概念解釋標準IO和系統IO的區別常用系統IO函數介紹打開文件關閉文件文件讀取文件寫入位置偏移 系統IO介面說明 概念解釋 由於Linux系統下“一切皆文件”,也就是Linux系統下的數據和程式都是以文件的形式存儲的,所以Linux內核會提供一組操作文件的函數介面,這組函數介面也被 ...
目錄
系統IO介面說明
概念解釋
由於Linux系統下“一切皆文件”,也就是Linux系統下的數據和程式都是以文件的形式存儲的,所以Linux內核會提供一組操作文件的函數介面,這組函數介面也被稱為系統IO,同時為了滿足用戶訪問文件的需求以及提高用戶程式的可移植性,標準庫也提供了一組操作文件的函數介面,這組函數介面也被稱為標準IO,只不過標準庫提供的標準IO函數都是遵循ANSI C標準設計出來,是為了方便用戶在不同的操作系統下可以調用通用的函數來實現對文件的讀寫訪問,但其實標準IO也是基於內核提供的系統IO設計出來的。
標準IO和系統IO的區別
-
標準IO提供了輸入輸出緩衝區,而系統IO不具備輸入輸出緩衝區。
該特性使得標準IO避免了頻繁的系統調用,且不用人為關心緩衝區大小的選擇,整體上提高了I/O的效率;而系統IO則無法高效的處理數據。原因是系統調用與普通函數調用相比通常需要花費更多的時間,因為系統調用的過程中內核要執行一系列的操作:首先內核需要捕獲調用,然後再檢查系統調用傳遞的參數的有效性,最後在用戶空間和內核空間之間傳輸數據。
-
系統IO能夠針對特定類型文件(鏈接文件、套接字文件等)進行訪問,一般適合訪問數據需要實時刷新的硬體設備(LCD、觸摸屏......);而標準IO做不到這點,標準IO一般適合訪問普通文件(規則文件)
簡單理解:
標準I/O可以看成是在系統I/O的基礎上封裝了緩衝機制。這樣可以先讀寫緩衝區,必要時再訪問實際文件,從而減少了系統調用的次數,提高訪問效率。例如:
fwrite() --> a.txt -->fwrite(buf,1,1,fp); --> write() --> 100個位元組要寫--> 調用100次write() -->慢
fwrite() --> a.txt -->fwrite(buf,1,100,fp); -->write() -->100個位元組要寫-->調用001次write() -->快
-
*標準IO利用鏈表管理打開文件,所以返回值為FILE 而系統IO利用順序表管理打開文件,所以返回值是一個文件描述符(非負整數),意為順序表數組的下標。
常用系統IO函數介紹
打開文件
Linux內核提供了用於打開文件的open函數,由於該函數屬於系統IO函數,所以在C99標準中是查詢不到的,可以在Linux系統的man手冊的第二個章節中找到系統IO函數的描述。
通過man手冊可知,open()的第一個參數為要打開的文件的路徑,第二個參數flags為打開文件的部分許可權【只讀、只寫,可讀可寫】,且flags必須在這三種許可權中選擇一個填寫。但是,設計者考慮到打開文件情況的多樣性,還設定了多個不同的許可權函數,使用時需要利用位或(bitwise-or)將多個模式連接,例如: O_RDONLY | O_CREAT
可以看到,open函數的第三個參數mode只有在open函數的第二個參數flags使用O_CREAT或者O_TMPFILE才會使用,也就是說,打開一個已經存在的文件使用第一個版本的open函數即可,第二個版本的open函數的mode參數是指利用open函數創建新文件時給新創建的文件一個指定許可權,被創建的文件的許可權其實就是Linux系統下文件的許可權,可以分為三種:
一般在Linux系統下可以直接使用shell命令來修改文件的許可權,比如指令chmod 0777 xxx.txt就是給該文檔一個最高許可權。註意:mode參數應該採用八進位。
註意:
由於此時mode參數採用八進位表示,所以在使用時應該加上八進位標識符0.
通過man手冊可以知道,如果文件打開成功,則open函數返回一個文件描述符,這個文件描述符是一個非負整數,並且這個非負整數是當前進程中未被分配的文件描述符中最小的。如果文件打開失敗,則open函數的返回值是-1,並且錯誤原因採用錯誤碼的方式進行存儲。
思考:
請問這個open函數的文件描述符有什麼作用?這個返回值對應的數字範圍是多少???
回答:
open函數的返回值可以理解為是被打開文件的代號,內核並不是以被打開文件的路徑和名稱來管理文件,而是在調用open函數的時候會從未分配的文件描述符中找到一個最小的提供給被打開的文件。在對文件進行讀寫(R/W)訪問時同樣是通過這個文件描述符實現。所以需要再打開文件時設置一個整型變數用於存儲open()返回的文件描述符。
- 文件描述符本質就是一個非負整數,從內核源碼角度分析,這個整數實際上是內核中的一個稱為 fd_array 的數組下標。
打開文件時,內核產生一個指向 file{} 的指針,並將該指針放入一個位於 file_struct{} 中的數組 fd_array[] 中,而該指針所在數組的下標,就被 open() 返回給用戶,所以內核把這個數組下標稱為文件描述符。
文件描述符從0開始分配,每打開一個文件,就產生一個新的文件描述符。當然,用戶可以重覆打開同一個文件,每次打開文件都會使內核產生新的結構體,並得到不同的文件描述符。
註意:
雖然文件描述符是從0開始分配,但由於我們打開文件一般是做讀寫操作,所以在打開文件之前,系統會打開三個標準文件【stdin、stdout、stderr】。因此,打開文件的描述符最小應該是從 3 開始。
思考:
可以知道一個程式中能打開的文件的數量最大為1024個,請問是否可以修改這個值
回答:
可以通過Linux系統提供了一個查看和修改系統資源的shell命令: ulimit -a 來列印當前系統所有資料的閾值
註意:
上圖所示的數值,均是由Linux內核設置,若是想要對其進行修改操作,則需要寫明修改項的參數,如想要對打開文件的數量進行修改:ulimit -n xxx(想要修改的數量)
且這樣的修改本次有效,若是想要一直有效,則需要將其寫入Linux內核代碼中。
關閉文件
Linux內核提供了用於關閉文件的close函數,由於該函數屬於系統IO函數,所以在C99標準中是查詢不到的,可以在Linux系統的man手冊的第二個章節中找到系統IO函數的描述。
註意:
close函數可以對同一個文件反覆調用,並且不會出錯,因為open函數沒有申請堆記憶體,但是多次調用close函數關閉同一個文件的動作是沒有意義。
文件讀取
Linux內核提供了用於讀取文件的read函數,由於該函數屬於系統IO函數,所以在C99標準中是查詢不到的,可以在Linux系統的man手冊的第二個章節中找到系統IO函數的描述。
由man手冊可知,read()需要三個參數,分別是讀取文件的路徑、存放讀取數據的自定義緩衝區和需要讀取的數量。且與fread()不同的是,read()能夠讀到最多count個數據,而不是count - 1個;
read()的返回值是讀取位元組數量,如果返回值是0,說明讀取到文件末尾,如果返回值是-1,說明讀取出錯。
文件寫入
Linux內核提供了用於寫入文件的write函數,由於該函數屬於系統IO函數,所以在C99標準中是查詢不到的,可以在Linux系統的man手冊的第二個章節中找到系統IO函數的描述。
位置偏移
Linux內核提供了用於設置文件位移的lseek函數,由於該函數屬於系統IO函數,所以在C99標準中是查詢不到的,可以在Linux系統的man手冊的第二個章節中找到系統IO函數的描述。
註意:
lseek()與fseek()使用規則一致,但是,lseek()會將文件指示器相較於文件開頭的偏移量,以位元組為單位返回。而fseek()需要藉助ftell()才能做到。