javaSE學習筆記(15) 緩衝流、轉換流、序列化流 緩衝流 昨天複習了基本的一些流,作為IO流的入門,今天我們要見識一些更強大的流。比如能夠高效讀寫的緩衝流,能夠轉換編碼的轉換流,能夠持久化存儲對象的序列化流等等。這些功能更為強大的流,都是在基本的流對象基礎之上創建而來的,相當於是對基本流對象的 ...
javaSE學習筆記(15) ---緩衝流、轉換流、序列化流
緩衝流
昨天複習了基本的一些流,作為IO流的入門,今天我們要見識一些更強大的流。比如能夠高效讀寫的緩衝流,能夠轉換編碼的轉換流,能夠持久化存儲對象的序列化流等等。這些功能更為強大的流,都是在基本的流對象基礎之上創建而來的,相當於是對基本流對象的一種增強。
概述
緩衝流,也叫高效流,是對4個基本的FileXxx
流的增強,所以也是4個流,按照數據類型分類:
- 位元組緩衝流:
BufferedInputStream
,BufferedOutputStream
- 字元緩衝流:
BufferedReader
,BufferedWriter
緩衝流的基本原理,是在創建流對象時,會創建一個內置的預設大小的緩衝區數組,通過緩衝區讀寫,減少系統IO次數,從而提高讀寫的效率。
位元組緩衝流
構造方法
public BufferedInputStream(InputStream in)
:創建一個 新的緩衝輸入流。public BufferedOutputStream(OutputStream out)
: 創建一個新的緩衝輸出流。
構造舉例,代碼如下:
// 創建位元組緩衝輸入流
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("bis.txt"));
// 創建位元組緩衝輸出流
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("bos.txt"));
效率測試
查詢API,緩衝流讀寫方法與基本的流是一致的,我們通過複製大文件(375MB),測試它的效率。
- 基本流,代碼如下:
public class BufferedDemo {
public static void main(String[] args) throws FileNotFoundException {
// 記錄開始時間
long start = System.currentTimeMillis();
// 創建流對象
try (
FileInputStream fis = new FileInputStream("jdk9.exe");
FileOutputStream fos = new FileOutputStream("copy.exe")
){
// 讀寫數據
int b;
while ((b = fis.read()) != -1) {
fos.write(b);
}
} catch (IOException e) {
e.printStackTrace();
}
// 記錄結束時間
long end = System.currentTimeMillis();
System.out.println("普通流複製時間:"+(end - start)+" 毫秒");
}
}
十幾分鐘過去了...
- 緩衝流,代碼如下:
public class BufferedDemo {
public static void main(String[] args) throws FileNotFoundException {
// 記錄開始時間
long start = System.currentTimeMillis();
// 創建流對象
try (
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("jdk9.exe"));
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("copy.exe"));
){
// 讀寫數據
int b;
while ((b = bis.read()) != -1) {
bos.write(b);
}
} catch (IOException e) {
e.printStackTrace();
}
// 記錄結束時間
long end = System.currentTimeMillis();
System.out.println("緩衝流複製時間:"+(end - start)+" 毫秒");
}
}
緩衝流複製時間:8016 毫秒
如何更快呢?
使用數組的方式,代碼如下:
public class BufferedDemo {
public static void main(String[] args) throws FileNotFoundException {
// 記錄開始時間
long start = System.currentTimeMillis();
// 創建流對象
try (
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("jdk9.exe"));
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("copy.exe"));
){
// 讀寫數據
int len;
byte[] bytes = new byte[8*1024];
while ((len = bis.read(bytes)) != -1) {
bos.write(bytes, 0 , len);
}
} catch (IOException e) {
e.printStackTrace();
}
// 記錄結束時間
long end = System.currentTimeMillis();
System.out.println("緩衝流使用數組複製時間:"+(end - start)+" 毫秒");
}
}
緩衝流使用數組複製時間:666 毫秒
字元緩衝流
構造方法
public BufferedReader(Reader in)
:創建一個 新的緩衝輸入流。public BufferedWriter(Writer out)
: 創建一個新的緩衝輸出流。
構造舉例,代碼如下:
// 創建字元緩衝輸入流
BufferedReader br = new BufferedReader(new FileReader("br.txt"));
// 創建字元緩衝輸出流
BufferedWriter bw = new BufferedWriter(new FileWriter("bw.txt"));
特有方法
字元緩衝流的基本方法與普通字元流調用方式一致,不再闡述,我們來看它們具備的特有方法。
- BufferedReader:
public String readLine()
: 讀一行文字。 - BufferedWriter:
public void newLine()
: 寫一行行分隔符,由系統屬性定義符號。
readLine
方法演示,代碼如下:
public class BufferedReaderDemo {
public static void main(String[] args) throws IOException {
// 創建流對象
BufferedReader br = new BufferedReader(new FileReader("in.txt"));
// 定義字元串,保存讀取的一行文字
String line = null;
// 迴圈讀取,讀取到最後返回null
while ((line = br.readLine())!=null) {
System.out.print(line);
System.out.println("------");
}
// 釋放資源
br.close();
}
}
newLine
方法演示,代碼如下:
public class BufferedWriterDemo throws IOException {
public static void main(String[] args) throws IOException {
// 創建流對象
BufferedWriter bw = new BufferedWriter(new FileWriter("out.txt"));
// 寫出數據
bw.write("黑馬");
// 寫出換行
bw.newLine();
bw.write("程式");
bw.newLine();
bw.write("員");
bw.newLine();
// 釋放資源
bw.close();
}
}
輸出效果:
黑馬
程式
員
練習:文本排序
請將文本信息恢復順序。
3.侍中、侍郎郭攸之、費禕、董允等,此皆良實,志慮忠純,是以先帝簡拔以遺陛下。愚以為宮中之事,事無大小,悉以咨之,然後施行,必得裨補闕漏,有所廣益。
8.願陛下托臣以討賊興復之效,不效,則治臣之罪,以告先帝之靈。若無興德之言,則責攸之、禕、允等之慢,以彰其咎;陛下亦宜自謀,以咨諏善道,察納雅言,深追先帝遺詔,臣不勝受恩感激。
4.將軍向寵,性行淑均,曉暢軍事,試用之於昔日,先帝稱之曰能,是以眾議舉寵為督。愚以為營中之事,悉以咨之,必能使行陣和睦,優劣得所。
2.宮中府中,俱為一體,陟罰臧否,不宜異同。若有作姦犯科及為忠善者,宜付有司論其刑賞,以昭陛下平明之理,不宜偏私,使內外異法也。
1.先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。然侍衛之臣不懈於內,忠志之士忘身於外者,蓋追先帝之殊遇,欲報之於陛下也。誠宜開張聖聽,以光先帝遺德,恢弘志士之氣,不宜妄自菲薄,引喻失義,以塞忠諫之路也。
9.今當遠離,臨表涕零,不知所言。
6.臣本布衣,躬耕於南陽,苟全性命於亂世,不求聞達於諸侯。先帝不以臣卑鄙,猥自枉屈,三顧臣於草廬之中,咨臣以當世之事,由是感激,遂許先帝以驅馳。後值傾覆,受任於敗軍之際,奉命於危難之間,爾來二十有一年矣。
7.先帝知臣謹慎,故臨崩寄臣以大事也。受命以來,夙夜憂嘆,恐付托不效,以傷先帝之明,故五月渡瀘,深入不毛。今南方已定,兵甲已足,當獎率三軍,北定中原,庶竭駑鈍,攘除姦凶,興復漢室,還於舊都。此臣所以報先帝而忠陛下之職分也。至於斟酌損益,進盡忠言,則攸之、禕、允之任也。
5.親賢臣,遠小人,此先漢所以興隆也;親小人,遠賢臣,此後漢所以傾頹也。先帝在時,每與臣論此事,未嘗不嘆息痛恨於桓、靈也。侍中、尚書、長史、參軍,此悉貞良死節之臣,願陛下親之信之,則漢室之隆,可計日而待也。
案例分析
- 逐行讀取文本信息。
- 解析文本信息到集合中。
- 遍歷集合,按順序,寫出文本信息。
案例實現
public class BufferedTest {
public static void main(String[] args) throws IOException {
// 創建map集合,保存文本數據,鍵為序號,值為文字
HashMap<String, String> lineMap = new HashMap<>();
// 創建流對象
BufferedReader br = new BufferedReader(new FileReader("in.txt"));
BufferedWriter bw = new BufferedWriter(new FileWriter("out.txt"));
// 讀取數據
String line = null;
while ((line = br.readLine())!=null) {
// 解析文本
String[] split = line.split("\\.");
// 保存到集合
lineMap.put(split[0],split[1]);
}
// 釋放資源
br.close();
// 遍歷map集合
for (int i = 1; i <= lineMap.size(); i++) {
String key = String.valueOf(i);
// 獲取map中文本
String value = lineMap.get(key);
// 寫出拼接文本
bw.write(key+"."+value);
// 寫出換行
bw.newLine();
}
// 釋放資源
bw.close();
}
}
轉換流
字元編碼和字元集
字元編碼
電腦中儲存的信息都是用二進位數表示的,而我們在屏幕上看到的數字、英文、標點符號、漢字等字元是二進位數轉換之後的結果。按照某種規則,將字元存儲到電腦中,稱為編碼 。反之,將存儲在電腦中的二進位數按照某種規則解析顯示出來,稱為解碼 。比如說,按照A規則存儲,同樣按照A規則解析,那麼就能顯示正確的文本符號。反之,按照A規則存儲,再按照B規則解析,就會導致亂碼現象。
編碼:字元(能看懂的)--位元組(看不懂的)
解碼:位元組(看不懂的)-->字元(能看懂的)
字元編碼
Character Encoding
: 就是一套自然語言的字元與二進位數之間的對應規則。編碼表:生活中文字和電腦中二進位的對應規則
字元集
- 字元集
Charset
:也叫編碼表。是一個系統支持的所有字元的集合,包括各國家文字、標點符號、圖形符號、數字等。
電腦要準確的存儲和識別各種字元集符號,需要進行字元編碼,一套字元集必然至少有一套字元編碼。常見字元集有ASCII字元集、GBK字元集、Unicode字元集等。
可見,當指定了編碼,它所對應的字元集自然就指定了,所以編碼才是我們最終要關心的。
- ASCII字元集 :
- ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼)是基於拉丁字母的一套電腦編碼系統,用於顯示現代英語,主要包括控制字元(回車鍵、退格、換行鍵等)和可顯示字元(英文大小寫字元、阿拉伯數字和西文符號)。
- 基本的ASCII字元集,使用7位(bits)表示一個字元,共128字元。ASCII的擴展字元集使用8位(bits)表示一個字元,共256字元,方便支持歐洲常用字元。
- ISO-8859-1字元集:
- 拉丁碼表,別名Latin-1,用於顯示歐洲使用的語言,包括荷蘭、丹麥、德語、義大利語、西班牙語等。
- ISO-8859-1使用單位元組編碼,相容ASCII編碼。
- GBxxx字元集:
- GB就是國標的意思,是為了顯示中文而設計的一套字元集。
- GB2312:簡體中文碼表。一個小於127的字元的意義與原來相同。但兩個大於127的字元連在一起時,就表示一個漢字,這樣大約可以組合了包含7000多個簡體漢字,此外數學符號、羅馬希臘的字母、日文的假名們都編進去了,連在ASCII里本來就有的數字、標點、字母都統統重新編了兩個位元組長的編碼,這就是常說的"全形"字元,而原來在127號以下的那些就叫"半形"字元了。
- GBK:最常用的中文碼表。是在GB2312標準基礎上的擴展規範,使用了雙位元組編碼方案,共收錄了21003個漢字,完全相容GB2312標準,同時支持繁體漢字以及日韓漢字等。
- GB18030:最新的中文碼表。收錄漢字70244個,採用多位元組編碼,每個字可以由1個、2個或4個位元組組成。支持中國國內少數民族的文字,同時支持繁體漢字以及日韓漢字等。
- Unicode字元集 :
- Unicode編碼系統為表達任意語言的任意字元而設計,是業界的一種標準,也稱為統一碼、標準萬國碼。
- 它最多使用4個位元組的數字來表達每個字母、符號,或者文字。有三種編碼方案,UTF-8、UTF-16和UTF-32。最為常用的UTF-8編碼。
- UTF-8編碼,可以用來表示Unicode標準中任何字元,它是電子郵件、網頁及其他存儲或傳送文字的應用中,優先採用的編碼。互聯網工程工作小組(IETF)要求所有互聯網協議都必須支持UTF-8編碼。所以,我們開發Web應用,也要使用UTF-8編碼。它使用一至四個位元組為每個字元編碼,編碼規則:
- 128個US-ASCII字元,只需一個位元組編碼。
- 拉丁文等字元,需要二個位元組編碼。
- 大部分常用字(含中文),使用三個位元組編碼。
- 其他極少使用的Unicode輔助字元,使用四位元組編碼。
編碼引出的問題
在IDEA中,使用FileReader
讀取項目中的文本文件。由於IDEA的設置,都是預設的UTF-8
編碼,所以沒有任何問題。但是,當讀取Windows系統中創建的文本文件時,由於Windows系統的預設是GBK編碼,就會出現亂碼。
public class ReaderDemo {
public static void main(String[] args) throws IOException {
FileReader fileReader = new FileReader("E:\\File_GBK.txt");
int read;
while ((read = fileReader.read()) != -1) {
System.out.print((char)read);
}
fileReader.close();
}
}
輸出結果:
���
那麼如何讀取GBK編碼的文件呢?
InputStreamReader類
轉換流java.io.InputStreamReader
,是Reader的子類,是從位元組流到字元流的橋梁。它讀取位元組,並使用指定的字元集將其解碼為字元。它的字元集可以由名稱指定,也可以接受平臺的預設字元集。
構造方法
InputStreamReader(InputStream in)
: 創建一個使用預設字元集的字元流。InputStreamReader(InputStream in, String charsetName)
: 創建一個指定字元集的字元流。
構造舉例,代碼如下:
InputStreamReader isr = new InputStreamReader(new FileInputStream("in.txt"));
InputStreamReader isr2 = new InputStreamReader(new FileInputStream("in.txt") , "GBK");
指定編碼讀取
public class ReaderDemo2 {
public static void main(String[] args) throws IOException {
// 定義文件路徑,文件為gbk編碼
String FileName = "E:\\file_gbk.txt";
// 創建流對象,預設UTF8編碼
InputStreamReader isr = new InputStreamReader(new FileInputStream(FileName));
// 創建流對象,指定GBK編碼
InputStreamReader isr2 = new InputStreamReader(new FileInputStream(FileName) , "GBK");
// 定義變數,保存字元
int read;
// 使用預設編碼字元流讀取,亂碼
while ((read = isr.read()) != -1) {
System.out.print((char)read); // ��Һ�
}
isr.close();
// 使用指定編碼字元流讀取,正常解析
while ((read = isr2.read()) != -1) {
System.out.print((char)read);// 大家好
}
isr2.close();
}
}
OutputStreamWriter類
轉換流java.io.OutputStreamWriter
,是Writer的子類,是從字元流到位元組流的橋梁。使用指定的字元集將字元編碼為位元組。它的字元集可以由名稱指定,也可以接受平臺的預設字元集。
構造方法
OutputStreamWriter(OutputStream in)
: 創建一個使用預設字元集的字元流。OutputStreamWriter(OutputStream in, String charsetName)
: 創建一個指定字元集的字元流。
構造舉例,代碼如下:
OutputStreamWriter isr = new OutputStreamWriter(new FileOutputStream("out.txt"));
OutputStreamWriter isr2 = new OutputStreamWriter(new FileOutputStream("out.txt") , "GBK");
指定編碼寫出
public class OutputDemo {
public static void main(String[] args) throws IOException {
// 定義文件路徑
String FileName = "E:\\out.txt";
// 創建流對象,預設UTF8編碼
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(FileName));
// 寫出數據
osw.write("你好"); // 保存為6個位元組
osw.close();
// 定義文件路徑
String FileName2 = "E:\\out2.txt";
// 創建流對象,指定GBK編碼
OutputStreamWriter osw2 = new OutputStreamWriter(new FileOutputStream(FileName2),"GBK");
// 寫出數據
osw2.write("你好");// 保存為4個位元組
osw2.close();
}
}
轉換流理解圖解
轉換流是位元組與字元間的橋梁!!
轉換文件編碼
將GBK編碼的文本文件,轉換為UTF-8編碼的文本文件。
案例分析
- 指定GBK編碼的轉換流,讀取文本文件。
- 使用UTF-8編碼的轉換流,寫出文本文件。
案例實現
public class TransDemo {
public static void main(String[] args) {
// 1.定義文件路徑
String srcFile = "file_gbk.txt";
String destFile = "file_utf8.txt";
// 2.創建流對象
// 2.1 轉換輸入流,指定GBK編碼
InputStreamReader isr = new InputStreamReader(new FileInputStream(srcFile) , "GBK");
// 2.2 轉換輸出流,預設utf8編碼
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(destFile));
// 3.讀寫數據
// 3.1 定義數組
char[] cbuf = new char[1024];
// 3.2 定義長度
int len;
// 3.3 迴圈讀取
while ((len = isr.read(cbuf))!=-1) {
// 迴圈寫出
osw.write(cbuf,0,len);
}
// 4.釋放資源
osw.close();
isr.close();
}
}
序列化
概述
Java 提供了一種對象序列化的機制。用一個位元組序列可以表示一個對象,該位元組序列包含該對象的數據
、對象的類型
和對象中存儲的屬性
等信息。位元組序列寫出到文件之後,相當於文件中持久保存了一個對象的信息。
反之,該位元組序列還可以從文件中讀取回來,重構對象,對它進行反序列化。對象的數據
、對象的類型
和對象中存儲的數據
信息,都可以用來在記憶體中創建對象。看圖理解序列化: !
ObjectOutputStream類
java.io.ObjectOutputStream
類,將Java對象的原始數據類型寫出到文件,實現對象的持久存儲。
構造方法
public ObjectOutputStream(OutputStream out)
: 創建一個指定OutputStream的ObjectOutputStream。
構造舉例,代碼如下:
FileOutputStream fileOut = new FileOutputStream("employee.txt");
ObjectOutputStream out = new ObjectOutputStream(fileOut);
序列化操作
- 一個對象要想序列化,必須滿足兩個條件:
- 該類必須實現
java.io.Serializable
介面,Serializable
是一個標記介面,不實現此介面的類將不會使任何狀態序列化或反序列化,會拋出NotSerializableException
。 - 該類的所有屬性必須是可序列化的。如果有一個屬性不需要可序列化的,則該屬性必須註明是瞬態的,使用
transient
關鍵字修飾。
public class Employee implements java.io.Serializable {
public String name;
public String address;
public transient int age; // transient瞬態修飾成員,不會被序列化
public void addressCheck() {
System.out.println("Address check : " + name + " -- " + address);
}
}
2.寫出對象方法
public final void writeObject (Object obj)
: 將指定的對象寫出。
public class SerializeDemo{
public static void main(String [] args) {
Employee e = new Employee();
e.name = "zhangsan";
e.address = "beiqinglu";
e.age = 20;
try {
// 創建序列化流對象
ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("employee.txt"));
// 寫出對象
out.writeObject(e);
// 釋放資源
out.close();
fileOut.close();
System.out.println("Serialized data is saved"); // 姓名,地址被序列化,年齡沒有被序列化。
} catch(IOException i) {
i.printStackTrace();
}
}
}
輸出結果:
Serialized data is saved
ObjectInputStream類
ObjectInputStream反序列化流,將之前使用ObjectOutputStream序列化的原始數據恢復為對象。
構造方法
public ObjectInputStream(InputStream in)
: 創建一個指定InputStream的ObjectInputStream。
反序列化操作1
如果能找到一個對象的class文件,我們可以進行反序列化操作,調用ObjectInputStream
讀取對象的方法:
public final Object readObject ()
: 讀取一個對象。
public class DeserializeDemo {
public static void main(String [] args) {
Employee e = null;
try {
// 創建反序列化流
FileInputStream fileIn = new FileInputStream("employee.txt");
ObjectInputStream in = new ObjectInputStream(fileIn);
// 讀取一個對象
e = (Employee) in.readObject();
// 釋放資源
in.close();
fileIn.close();
}catch(IOException i) {
// 捕獲其他異常
i.printStackTrace();
return;
}catch(ClassNotFoundException c) {
// 捕獲類找不到異常
System.out.println("Employee class not found");
c.printStackTrace();
return;
}
// 無異常,直接列印輸出
System.out.println("Name: " + e.name); // zhangsan
System.out.println("Address: " + e.address); // beiqinglu
System.out.println("age: " + e.age); // 0
}
}
對於JVM可以反序列化對象,它必須是能夠找到class文件的類。如果找不到該類的class文件,則拋出一個 ClassNotFoundException
異常。
反序列化操作2
另外,當JVM反序列化對象時,能找到class文件,但是class文件在序列化對象之後發生了修改,那麼反序列化操作也會失敗,拋出一個InvalidClassException
異常。發生這個異常的原因如下:
- 該類的序列版本號與從流中讀取的類描述符的版本號不匹配
- 該類包含未知數據類型
- 該類沒有可訪問的無參數構造方法
Serializable
介面給需要序列化的類,提供了一個序列版本號。serialVersionUID
該版本號的目的在於驗證序列化的對象和對應類是否版本匹配。
public class Employee implements java.io.Serializable {
// 加入序列版本號
private static final long serialVersionUID = 1L;
public String name;
public String address;
// 添加新的屬性 ,重新編譯, 可以反序列化,該屬性賦為預設值.
public int eid;
public void addressCheck() {
System.out.println("Address check : " + name + " -- " + address);
}
}
練習:序列化集合
- 將存有多個自定義對象的集合序列化操作,保存到
list.txt
文件中。 - 反序列化
list.txt
,並遍歷集合,列印對象信息。
案例分析
- 把若幹學生對象 ,保存到集合中。
- 把集合序列化。
- 反序列化讀取時,只需要讀取一次,轉換為集合類型。
- 遍歷集合,可以列印所有的學生信息
案例實現
public class SerTest {
public static void main(String[] args) throws Exception {
// 創建 學生對象
Student student = new Student("老王", "laow");
Student student2 = new Student("老張", "laoz");
Student student3 = new Student("老李", "laol");
ArrayList<Student> arrayList = new ArrayList<>();
arrayList.add(student);
arrayList.add(student2);
arrayList.add(student3);
// 序列化操作
// serializ(arrayList);
// 反序列化
ObjectInputStream ois = new ObjectInputStream(new FileInputStream("list.txt"));
// 讀取對象,強轉為ArrayList類型
ArrayList<Student> list = (ArrayList<Student>)ois.readObject();
for (int i = 0; i < list.size(); i++ ){
Student s = list.get(i);
System.out.println(s.getName()+"--"+ s.getPwd());
}
}
private static void serializ(ArrayList<Student> arrayList) throws Exception {
// 創建 序列化流
ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("list.txt"));
// 寫出對象
oos.writeObject(arrayList);
// 釋放資源
oos.close();
}
}
列印流
概述
平時我們在控制台列印輸出,是調用print
方法和println
方法完成的,這兩個方法都來自於java.io.PrintStream
類,該類能夠方便地列印各種數據類型的值,是一種便捷的輸出方式。
PrintStream類
構造方法
public PrintStream(String fileName)
: 使用指定的文件名創建一個新的列印流。
構造舉例,代碼如下:
PrintStream ps = new PrintStream("ps.txt");
改變列印流向
System.out
就是PrintStream
類型的,只不過它的流向是系統規定的,列印在控制臺上。不過,既然是流對象,我們就可以玩一個"小把戲",改變它的流向。
public class PrintDemo {
public static void main(String[] args) throws IOException {
// 調用系統的列印流,控制台直接輸出97
System.out.println(97);
// 創建列印流,指定文件的名稱
PrintStream ps = new PrintStream("ps.txt");
// 設置系統的列印流流向,輸出到ps.txt
System.setOut(ps);
// 調用系統的列印流,ps.txt中輸出97
System.out.println(97);
}
}