前面介紹的文件I/O,不管是寫入文本還是寫入對象,文件中的數據基本是原來的模樣,用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據,要說方便確實方便,只是不夠經濟划算,原因有二:其一,寫入的數據可能存在大量重覆的信息,但依原樣寫到文件的話,無疑保留了不少冗餘數據,造成空間浪費;其二,寫入的數據多 ...
前面介紹的文件I/O,不管是寫入文本還是寫入對象,文件中的數據基本是原來的模樣,用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據,要說方便確實方便,只是不夠經濟划算,原因有二:其一,寫入的數據可能存在大量重覆的信息,但依原樣寫到文件的話,無疑保留了不少冗餘數據,造成空間浪費;其二,寫入的數據多以明文方式保存,容易產生信息泄露,安全性不高。為此Java提供了簡單的壓縮和解壓工具,在將數據寫入文件之前,先對數據進行壓縮,再將壓縮後的結果寫到文件;同樣讀取壓縮文件之時,先讀出已壓縮的數據,再將這些數據進行解壓,解壓後的結果即為最初的原始數據。
在IO流的家族體系中,壓縮與解壓操作需要GZIPOutputStream、GZIPInputStream、ByteArrayOutputStream、ByteArrayInputStream這四個工具類互相配合,分別簡述如下:
GZIPOutputStream:壓縮輸出流。它吃進去的是原始數據的位元組數組,拉出來的是位元組數組輸出流對象(壓縮後的數據)。
ByteArrayOutputStream:位元組數組輸出流。它從壓縮輸出流獲取壓縮後的數據,並通過toByteArray方法輸出位元組數組信息。或者從壓縮輸入流獲取解壓後的數據,並通過toByteArray方法輸出位元組數組信息。
GZIPInputStream:壓縮輸入流。它吃進去的是位元組數組輸入流對象(壓縮後的數據),拉出來的是解壓後的位元組數組(原始數據)。
ByteArrayInputStream:位元組數組輸入流。它輸入壓縮數據的位元組數組,轉成流對象後丟給壓縮輸入流。
上面的工具介紹描述看上去索然無味,確實要運用到實際案例中才比較好理解。接下來先來瞧瞧原始字元串是怎麼變成壓縮數據的,詳細的壓縮過程代碼示例如下:
// 從字元串獲得壓縮後的位元組數組 private static byte[] compress(String str) { if (str==null || str.length()<=0) { return null; } byte[] zip_bytes = null; // 聲明壓縮數據的位元組數組 // 先構建位元組數組輸出流,再據此構建壓縮輸出流 try (ByteArrayOutputStream baos = new ByteArrayOutputStream(); GZIPOutputStream gos = new GZIPOutputStream(baos);) { gos.write(str.getBytes()); // 往壓縮輸出流寫入位元組數組 gos.finish(); // 結束寫入操作 zip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息 } catch (Exception e) { e.printStackTrace(); } return zip_bytes; }
既已得到壓縮後的位元組數組,將其寫入文件之中真是易如反掌,下麵是往文件寫入壓縮數據的代碼例子:
// 往文件寫入壓縮後的數據 private static void writeZipFile() { String str = "白日依山盡,黃河入海流。\n欲窮千里目,更上一層樓。"; // 根據指定文件路徑構建文件輸出流對象 try (FileOutputStream fos = new FileOutputStream(mFileName)) { // 從字元串獲得壓縮後的位元組數組 byte[] zip_bytes = compress(str); fos.write(zip_bytes); // 把位元組數組寫入文件輸出流 } catch (Exception e) { e.printStackTrace(); } }
再來看看如何從壓縮文件中讀到解壓後的原始數據,把壓縮後的數據還原為初始字元串要複雜一些,需要ByteArrayInputStream、GZIPInputStream、ByteArrayOutputStream三個工具互相配合,具體的解壓過程代碼如下所示:
// 從壓縮位元組數組獲得解壓後的字元串 private static String uncompress(byte[] bytes) { if (bytes==null || bytes.length<=0) { return null; } byte[] unzip_bytes = null; // 聲明解壓數據的位元組數組 // 分別構建位元組數組輸出流,以及位元組數組輸入流,並根據位元組數組輸入流構建壓縮輸入流 try (ByteArrayOutputStream baos = new ByteArrayOutputStream(); ByteArrayInputStream bais = new ByteArrayInputStream(bytes); GZIPInputStream gis = new GZIPInputStream(bais);) { byte[] buffer = new byte[1024]; while (true) { // 從壓縮輸入流中讀取數據到位元組數組,並返回讀到的數據長度 int length = gis.read(buffer); if (length < 0) { // 未讀到數據,表示已經讀完了 break; } baos.write(buffer); // 往位元組數組輸出流寫入位元組數組 } unzip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息 } catch (Exception e) { e.printStackTrace(); } return new String(unzip_bytes); // 把位元組數組轉換為字元串,並返回該字元串 }
利用剛剛編寫的uncompress解壓方法,很容易從壓縮文件中得到原始字元串,下麵是從壓縮文件讀取解壓數據的代碼例子:
// 從壓縮文件中讀取解壓後的數據 private static void readZipFile() { // 根據指定文件路徑構建文件輸入流對象 try (FileInputStream fis = new FileInputStream(mFileName)) { // 分配長度為文件大小的位元組數組。available方法返回當前未讀取的大小 byte[] bytes = new byte[fis.available()]; fis.read(bytes); // 從文件輸入流中讀取位元組數組 // 從壓縮位元組數組獲得解壓後的字元串 String content = uncompress(bytes); System.out.println("content="+content); } catch (Exception e) { e.printStackTrace(); } }
更多Java技術文章參見《Java開發筆記(序)章節目錄》