Java開發筆記（九十一）IO流處理簡單的數據壓縮

-Advertisement-

前面介紹的文件I/O，不管是寫入文本還是寫入對象，文件中的數據基本是原來的模樣，用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據，要說方便確實方便，只是不夠經濟划算，原因有二：其一，寫入的數據可能存在大量重覆的信息，但依原樣寫到文件的話，無疑保留了不少冗餘數據，造成空間浪費；其二，寫入的數據多 ...

前面介紹的文件I/O，不管是寫入文本還是寫入對象，文件中的數據基本是原來的模樣，用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據，要說方便確實方便，只是不夠經濟划算，原因有二：其一，寫入的數據可能存在大量重覆的信息，但依原樣寫到文件的話，無疑保留了不少冗餘數據，造成空間浪費；其二，寫入的數據多以明文方式保存，容易產生信息泄露，安全性不高。為此Java提供了簡單的壓縮和解壓工具，在將數據寫入文件之前，先對數據進行壓縮，再將壓縮後的結果寫到文件；同樣讀取壓縮文件之時，先讀出已壓縮的數據，再將這些數據進行解壓，解壓後的結果即為最初的原始數據。
在IO流的家族體系中，壓縮與解壓操作需要GZIPOutputStream、GZIPInputStream、ByteArrayOutputStream、ByteArrayInputStream這四個工具類互相配合，分別簡述如下：
GZIPOutputStream：壓縮輸出流。它吃進去的是原始數據的位元組數組，拉出來的是位元組數組輸出流對象（壓縮後的數據）。
ByteArrayOutputStream：位元組數組輸出流。它從壓縮輸出流獲取壓縮後的數據，並通過toByteArray方法輸出位元組數組信息。或者從壓縮輸入流獲取解壓後的數據，並通過toByteArray方法輸出位元組數組信息。
GZIPInputStream：壓縮輸入流。它吃進去的是位元組數組輸入流對象（壓縮後的數據），拉出來的是解壓後的位元組數組（原始數據）。
ByteArrayInputStream：位元組數組輸入流。它輸入壓縮數據的位元組數組，轉成流對象後丟給壓縮輸入流。
上面的工具介紹描述看上去索然無味，確實要運用到實際案例中才比較好理解。接下來先來瞧瞧原始字元串是怎麼變成壓縮數據的，詳細的壓縮過程代碼示例如下：

	// 從字元串獲得壓縮後的位元組數組
	private static byte[] compress(String str) {
		if (str==null || str.length()<=0) {
			return null;
		}
		byte[] zip_bytes = null; // 聲明壓縮數據的位元組數組
		// 先構建位元組數組輸出流，再據此構建壓縮輸出流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				GZIPOutputStream gos = new GZIPOutputStream(baos);) {
			gos.write(str.getBytes()); // 往壓縮輸出流寫入位元組數組
			gos.finish(); // 結束寫入操作
			zip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return zip_bytes;
	}

既已得到壓縮後的位元組數組，將其寫入文件之中真是易如反掌，下麵是往文件寫入壓縮數據的代碼例子：

	// 往文件寫入壓縮後的數據
	private static void writeZipFile() {
		String str = "白日依山盡，黃河入海流。\n欲窮千里目，更上一層樓。";
		// 根據指定文件路徑構建文件輸出流對象
		try (FileOutputStream fos = new FileOutputStream(mFileName)) {
			// 從字元串獲得壓縮後的位元組數組
			byte[] zip_bytes = compress(str);
			fos.write(zip_bytes); // 把位元組數組寫入文件輸出流
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

再來看看如何從壓縮文件中讀到解壓後的原始數據，把壓縮後的數據還原為初始字元串要複雜一些，需要ByteArrayInputStream、GZIPInputStream、ByteArrayOutputStream三個工具互相配合，具體的解壓過程代碼如下所示：

	// 從壓縮位元組數組獲得解壓後的字元串
	private static String uncompress(byte[] bytes) {
		if (bytes==null || bytes.length<=0) {
			return null;
		}
		byte[] unzip_bytes = null; // 聲明解壓數據的位元組數組
		// 分別構建位元組數組輸出流，以及位元組數組輸入流，並根據位元組數組輸入流構建壓縮輸入流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
				GZIPInputStream gis = new GZIPInputStream(bais);) {
			byte[] buffer = new byte[1024];
			while (true) {
				// 從壓縮輸入流中讀取數據到位元組數組，並返回讀到的數據長度
				int length = gis.read(buffer);
				if (length < 0) { // 未讀到數據，表示已經讀完了
					break;
				}
				baos.write(buffer); // 往位元組數組輸出流寫入位元組數組
			}
			unzip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return new String(unzip_bytes); // 把位元組數組轉換為字元串，並返回該字元串
	}

利用剛剛編寫的uncompress解壓方法，很容易從壓縮文件中得到原始字元串，下麵是從壓縮文件讀取解壓數據的代碼例子：

	// 從壓縮文件中讀取解壓後的數據
	private static void readZipFile() {
		// 根據指定文件路徑構建文件輸入流對象
		try (FileInputStream fis = new FileInputStream(mFileName)) {
			// 分配長度為文件大小的位元組數組。available方法返回當前未讀取的大小
			byte[] bytes = new byte[fis.available()];
			fis.read(bytes); // 從文件輸入流中讀取位元組數組
			// 從壓縮位元組數組獲得解壓後的字元串
			String content = uncompress(bytes);
			System.out.println("content="+content);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

更多Java技術文章參見《Java開發筆記（序）章節目錄》

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

匿名函數

[TOC] 有名函數(掌握) 我們之前定的函數都是有名函數，它是基於函數名使用。 from func from func from func 匿名函數(掌握) 匿名函數，他沒有綁定名字，使用一次即被收回，加括弧既可以運行。 (x, y) 3 與內置函數聯用(掌握) 匿名函數通常與max()、min( ...
Python基礎之公共方法

Python基礎之容器類型的公共方法，包括 Python內置函數，切片，運算符，完整的for迴圈。其中，Python內置函數包括內置函數羅列，內置函數使用；切片僅包含切片的定義和使用；運算符包括運算符羅列，運算符的使用；完整的for迴圈包括完整的for迴圈語法，for迴圈演示，break打... ...
常用類

1.包裝類把八大基本數據類型封裝到一個類中（包裝類），並提供屬性和方法。讓我們更加方便的操作基本數據類型。但包裝類的出現並不是為了取代基本數據類型，也取代不了。包裝類位於java.lang包中。 Number 類 Number數值類型是byte、double、float、int、long 和 s ...
死磕 java集合之ArrayDeque源碼分析

什麼是雙端隊列？ ArrayDeque是怎麼實現雙端隊列的？ ArrayDeque是線程安全的嗎？ ArrayDeque是有界的嗎？ ...
F#周報2019年第17期

新聞 ".NET版本的Apache Spark" "Apache Spark預覽版介紹" "F Apache Spark示例" "微軟Build 2019大會(5月6日至8日)" "Rider用於F 的解決方案內的重命名" "Spark+AI峰會——開發智能雲與智能邊緣" "CNTK最新的重大發佈— ...
PHP常量

1.常量是什麼？有什麼存在的意思？答：舉個例子，公司開發，資料庫的地址用戶名密碼等信息一般固定不變，不需要後面程式改動。如果用變數，$db = 'xx';其他人寫程式，後面好巧不巧，修改了這個變數，是不是就出問題了。再比如，程式中要用到圓周率等，用變數存，就怕哪天被修改了，程式上是不會報錯的， ...
swagger知識點補充

1. swagger知識點補充 1.1. 概述 1. 在swagger的使用過程中，除了網上常見的例子，還會有很多細節上的東西需要註意和改寫，這裡我列幾點我使用過程中遇到的問題和改進方式 1.2. 知識點 1.2.1. 模型例子 1. 我們在進行POST的請求的時候，尤其是增加一條數據，我們往往會有 ...
Java核心技術梳理-泛型

一、引言在學習集合的時候我們會發現一個問題，將一個對象丟到集合中後，集合併不記住對象的類型，統統都當做Object處理，這樣我們取出來再使用時就得強制轉換類型，導致代碼臃腫，而且加入集合時都是以Object，沒做類型檢查，那麼強制轉換就容易出錯，泛型的誕生就是為解決這些問題。二、使用泛型泛型是 ...