0. 前言 在之前的章節中,大致介紹了C 中的一些基本概念。這篇我們將介紹一下C 的I/O操作,這將也是一個小連續劇。這是第一集,我們先來簡單瞭解一下C 中的I/O框架。 1. 什麼是I/O I/O 的全稱是input/output,翻譯過來就是輸入/輸出。對於一個系統或者電腦來說,鍵盤、U盤、網 ...
0. 前言
在之前的章節中,大致介紹了C#中的一些基本概念。這篇我們將介紹一下C#的I/O操作,這將也是一個小連續劇。這是第一集,我們先來簡單瞭解一下C#中的I/O框架。
1. 什麼是I/O
I/O 的全稱是input/output,翻譯過來就是輸入/輸出。對於一個系統或者電腦來說,鍵盤、U盤、網路介面、顯示器、音響、攝像頭等都是IO設備。那麼,對於一個程式I/O又是什麼呢?
對於程式而言,I/O就是與外界進行數據交換的方式。借用一句廣告詞,程式不生產數據,只是數據的搬用工。當然,正如XX還需要對水進行過濾、消毒等工序一樣,程式也要對數據進行運算,所以也不完全算是搬用工,嚴格來講是加工廠。那麼,I/O就是工廠的原料提供商和成品銷售商。
在C# 中,I/O體系整體分為三個部分,後臺存儲流、裝飾器流、流適配器,具體劃分如下圖所示:
在流與流之間,都是採用位元組數據進行交換,所以可以得到一個簡單的結論,I/O在程式中表現為位元組流,換句話說I/O就是將各種數據轉成位元組的工具。
3. Stream 基類
C#中,所有流都是繼承自Stream類,Stream類定義了流應該具有的行為和屬性,使得開發人員可以忽略底層的操作系統和基礎設備的具體細節。C#對流的處理忽略了讀流和寫流的區別,使其更像是一個管道,方便數據通信。流涉及到三個基本操作:
- 讀取 - 將數據從流中傳輸到數據結構中
- 寫入 - 將數據從數據源寫入流中
- 查找 - 對流中操作的當前位置進行查找和修改
因為流的特性,可能並不是所有的流都支持這三種操作,所以Stream提供了三個屬性,以方便確認流是否支持這三種操作:
public abstract bool CanRead { get; } // 獲取指示當前流是否支持讀取的值
public abstract bool CanWrite { get; } // 獲取指示當前流是否支持寫入功能的值
public abstract bool CanSeek { get; } // 獲取指示當前流是否支持查找功能的值
以上這三個屬性均由子類根據自身特性確認是否支持讀取、寫入、查找,可能三個屬性不會都為true,但絕對不會都為false。
下麵是一些常見的流:
- FileStream 用來操作文件的流
- MemoryStream 操作記憶體的流
- BufferedStream 緩存流,用來增強其他流的操作性能
- NetworkStream 使用網路套接字進行操作的流
- PipeStream 通過匿名和命名管道進行讀取和寫入
- CryptoStream 用於將數據流鏈接到加密轉換
4. 操作
C# 中I/O的操作都屬於System.IO
這個命名空間,在這個命名空間中C# 定義了文件相關的類、各種流、裝飾器流、適配器以及其他一些相關的結構體。在以System.IO
開頭的命名空間中,C#對IO進一步擴展,並提供了流壓縮和解壓縮(System.IO.Compression
),搜索和枚舉文件系統元素(System.IO.Enumeration
),提供用於使用記憶體映射文件的類(System.IO.MemoryMappedFiles
)等內容。
我們先略過之後篇幅會介紹的內容不提,先來看一下Stream類里重要的屬性和方法:
1. 流里數據的長度
public abstract long Length { get; }
當Stream對象的CanSeek為true時,也就是流支持搜索的時候,可以通過這個屬性確認流的長度,也就是有多少個位元組的數據。
2. 流的位置
public abstract long Position { get; set; }
同長度的前提條件一致,當Stream對象支持搜索的時候,可以通過該屬性確認流的位置或者修改流的位置。
3. 讀取流里的數據
public abstract int Read (byte[] buffer, int offset, int count);
public virtual int ReadByte ();
這是兩種不同的讀取方式,第一種是每次讀取多個位元組的數據,第二個是每次只讀一個位元組的數據。這裡來細細講解一下區別:
public abstract int Read (byte[] buffer, int offset, int count);
表示流每次最多讀取count個位元組的數據,然後將數據放到buffer中,位置從下標為offset開始,並返回實際讀取的位元組數,如果流已經讀完了,則返回0。這個過程中,Position會後移實際讀取長度,如果流支持搜索,程式中可以調用這個屬性。
所以這裡就有會這樣的一個限制:offset + count <= buffer.Length
,換句話說,偏移量 + 最大讀取數目不能大於緩存數組的長度。
因為這個方法返回一個實際讀取長度,可能有人會這樣判斷是否讀完:根據返回的結果與count比,如果返回的長度小於count則認為流已經讀完;否則流還沒讀完。
有一些流可能會達成這樣的效果,但是很多流並不能以此為依據來判斷流是否讀完,也許某一次讀取長度小於count,然後再讀一次發現又有數據了。這是因為IO在系統中屬於高耗時操作,大部分情況下IO的性能和程式的運算速度相差甚遠。所以經常會出現這樣的情景:流的長度是100,給了長度為100的緩存位元組數組,然後第一次讀取了10個位元組,第二次讀取了5個位元組,這樣一點一點的把這100個位元組讀取到。
所以,必須以返回值為0作為流的讀完判斷依據。
public virtual int ReadByte ();
這個方法很簡單,每次從流里讀取一個位元組的數據,如果讀取完成返回-1。可能有人會疑惑了,這個方法明明是讀取一個位元組,也就是個byte,那為什麼返回類型是int呢?很簡單,因為byte沒有負數,而int有。所以,當返回值不等於-1的時候,可以放心的類型轉換為byte。
4. 把數據寫入流
public abstract void Write (byte[] buffer, int offset, int count);
public virtual void WriteByte (byte value);
流的寫入與讀取相比就簡單多了,至少我們不用判斷流的位置。現在簡單分析一下:
public abstract void Write (byte[] buffer, int offset, int count);
表示從buffer的offset下標開始,取count個位元組寫入流里。所以,對offset、count的限制依舊,和不能大於數組的長度。寫入成功,流的位置會移動,否則將保持現有位置。
public virtual void WriteByte (byte value);
這個方法就更簡單了,直接寫一個位元組給流。
5. 關閉或銷毀流
流在操作完成之後,需要將其關閉以釋放流所持有的文件或IO設備等資源。很多人在使用電腦的時候,不能用QQ發送在本地已經打開的excel文件,它會提示文件被占用無法傳輸。這就是因為Excel打開了這個文件,就持有一個文件相關的流,所以QQ無法發送。解決辦法很簡單,關掉excel軟體即可。回到當前,也就是我們在使用完成之後必須關閉流。
那麼我們該如何關閉流呢?調用以下方法:
public virtual void Close ();
C#雖然設置了Close方法,但是並不支持開發者在編寫程式的時候手動調用Close方法,更推薦使用:
public void Dispose ();
這個方法會將釋放流所持有使用的資源,並關閉流。
當前需要註意的一個地方是,在把流關閉或釋放之前把流里的數據推送到基礎設備,即調用:
public abstract void Flush ();
有一些流設置了自動推送功能,如果遇到這種流則不需要手動調用該方法。
對於流來說,一旦銷毀或關閉,這個流就無法二次使用了,所以調用了Close、Dispose之後再次嘗試讀取/寫入流都會報錯
5. 本篇總結以及下篇預告
本篇內容大概介紹了一下C#的IO體系以及一些基本操作,下一篇將介紹如何操作文件。
更多內容煩請關註我的博客