Java開發筆記(九十一)IO流處理簡單的數據壓縮

来源:https://www.cnblogs.com/pinlantu/archive/2019/04/29/10793284.html
-Advertisement-
Play Games

前面介紹的文件I/O,不管是寫入文本還是寫入對象,文件中的數據基本是原來的模樣,用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據,要說方便確實方便,只是不夠經濟划算,原因有二:其一,寫入的數據可能存在大量重覆的信息,但依原樣寫到文件的話,無疑保留了不少冗餘數據,造成空間浪費;其二,寫入的數據多 ...


前面介紹的文件I/O,不管是寫入文本還是寫入對象,文件中的數據基本是原來的模樣,用記事本之類的文本編輯軟體都能瀏覽個大概。這麼存儲數據,要說方便確實方便,只是不夠經濟划算,原因有二:其一,寫入的數據可能存在大量重覆的信息,但依原樣寫到文件的話,無疑保留了不少冗餘數據,造成空間浪費;其二,寫入的數據多以明文方式保存,容易產生信息泄露,安全性不高。為此Java提供了簡單的壓縮和解壓工具,在將數據寫入文件之前,先對數據進行壓縮,再將壓縮後的結果寫到文件;同樣讀取壓縮文件之時,先讀出已壓縮的數據,再將這些數據進行解壓,解壓後的結果即為最初的原始數據。
在IO流的家族體系中,壓縮與解壓操作需要GZIPOutputStream、GZIPInputStream、ByteArrayOutputStream、ByteArrayInputStream這四個工具類互相配合,分別簡述如下:
GZIPOutputStream:壓縮輸出流。它吃進去的是原始數據的位元組數組,拉出來的是位元組數組輸出流對象(壓縮後的數據)。
ByteArrayOutputStream:位元組數組輸出流。它從壓縮輸出流獲取壓縮後的數據,並通過toByteArray方法輸出位元組數組信息。或者從壓縮輸入流獲取解壓後的數據,並通過toByteArray方法輸出位元組數組信息。
GZIPInputStream:壓縮輸入流。它吃進去的是位元組數組輸入流對象(壓縮後的數據),拉出來的是解壓後的位元組數組(原始數據)。
ByteArrayInputStream:位元組數組輸入流。它輸入壓縮數據的位元組數組,轉成流對象後丟給壓縮輸入流。
上面的工具介紹描述看上去索然無味,確實要運用到實際案例中才比較好理解。接下來先來瞧瞧原始字元串是怎麼變成壓縮數據的,詳細的壓縮過程代碼示例如下:

	// 從字元串獲得壓縮後的位元組數組
	private static byte[] compress(String str) {
		if (str==null || str.length()<=0) {
			return null;
		}
		byte[] zip_bytes = null; // 聲明壓縮數據的位元組數組
		// 先構建位元組數組輸出流,再據此構建壓縮輸出流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				GZIPOutputStream gos = new GZIPOutputStream(baos);) {
			gos.write(str.getBytes()); // 往壓縮輸出流寫入位元組數組
			gos.finish(); // 結束寫入操作
			zip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return zip_bytes;
	}

 

既已得到壓縮後的位元組數組,將其寫入文件之中真是易如反掌,下麵是往文件寫入壓縮數據的代碼例子:

	// 往文件寫入壓縮後的數據
	private static void writeZipFile() {
		String str = "白日依山盡,黃河入海流。\n欲窮千里目,更上一層樓。";
		// 根據指定文件路徑構建文件輸出流對象
		try (FileOutputStream fos = new FileOutputStream(mFileName)) {
			// 從字元串獲得壓縮後的位元組數組
			byte[] zip_bytes = compress(str);
			fos.write(zip_bytes); // 把位元組數組寫入文件輸出流
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 

再來看看如何從壓縮文件中讀到解壓後的原始數據,把壓縮後的數據還原為初始字元串要複雜一些,需要ByteArrayInputStream、GZIPInputStream、ByteArrayOutputStream三個工具互相配合,具體的解壓過程代碼如下所示:

	// 從壓縮位元組數組獲得解壓後的字元串
	private static String uncompress(byte[] bytes) {
		if (bytes==null || bytes.length<=0) {
			return null;
		}
		byte[] unzip_bytes = null; // 聲明解壓數據的位元組數組
		// 分別構建位元組數組輸出流,以及位元組數組輸入流,並根據位元組數組輸入流構建壓縮輸入流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
				GZIPInputStream gis = new GZIPInputStream(bais);) {
			byte[] buffer = new byte[1024];
			while (true) {
				// 從壓縮輸入流中讀取數據到位元組數組,並返回讀到的數據長度
				int length = gis.read(buffer);
				if (length < 0) { // 未讀到數據,表示已經讀完了
					break;
				}
				baos.write(buffer); // 往位元組數組輸出流寫入位元組數組
			}
			unzip_bytes = baos.toByteArray(); // 從位元組數組輸出流中獲取位元組數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return new String(unzip_bytes); // 把位元組數組轉換為字元串,並返回該字元串
	}

 

利用剛剛編寫的uncompress解壓方法,很容易從壓縮文件中得到原始字元串,下麵是從壓縮文件讀取解壓數據的代碼例子:

	// 從壓縮文件中讀取解壓後的數據
	private static void readZipFile() {
		// 根據指定文件路徑構建文件輸入流對象
		try (FileInputStream fis = new FileInputStream(mFileName)) {
			// 分配長度為文件大小的位元組數組。available方法返回當前未讀取的大小
			byte[] bytes = new byte[fis.available()];
			fis.read(bytes); // 從文件輸入流中讀取位元組數組
			// 從壓縮位元組數組獲得解壓後的字元串
			String content = uncompress(bytes);
			System.out.println("content="+content);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 


更多Java技術文章參見《Java開發筆記(序)章節目錄


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [TOC] 有名函數(掌握) 我們之前定的函數都是有名函數,它是基於函數名使用。 from func from func from func 匿名函數(掌握) 匿名函數,他沒有綁定名字,使用一次即被收回,加括弧既可以運行。 (x, y) 3 與內置函數聯用(掌握) 匿名函數通常與max()、min( ...
  • Python基礎之容器類型的公共方法,包括 Python內置函數,切片,運算符,完整的for迴圈。其中,Python內置函數包括 內置函數羅列,內置函數使用;切片僅 包含切片的定義和使用;運算符包括 運算符羅列,運算符的使用;完整的for迴圈 包括 完整的for迴圈語法,for迴圈演示,break打... ...
  • 1.包裝類 把八大基本數據類型封裝到一個類中(包裝類),並提供屬性和方法。讓我們更加方便的操作基本數據類型。但包裝類的出現並不是為了取代基本數據類型,也取代不了。 包裝類位於java.lang包中。 Number 類 Number數值類型是byte、double、float、int、long 和 s ...
  • 什麼是雙端隊列? ArrayDeque是怎麼實現雙端隊列的? ArrayDeque是線程安全的嗎? ArrayDeque是有界的嗎? ...
  • 新聞 ".NET版本的Apache Spark" "Apache Spark預覽版介紹" "F Apache Spark示例" "微軟Build 2019大會(5月6日至8日)" "Rider用於F 的解決方案內的重命名" "Spark+AI峰會——開發智能雲與智能邊緣" "CNTK最新的重大發佈— ...
  • 1.常量是什麼?有什麼存在的意思? 答:舉個例子,公司開發,資料庫的地址用戶名密碼等信息一般固定不變,不需要後面程式改動。 如果用變數,$db = 'xx';其他人寫程式,後面好巧不巧,修改了這個變數,是不是就出問題了。 再比如,程式中要用到圓周率等,用變數存,就怕哪天被修改了,程式上是不會報錯的, ...
  • 1. swagger知識點補充 1.1. 概述 1. 在swagger的使用過程中,除了網上常見的例子,還會有很多細節上的東西需要註意和改寫,這裡我列幾點我使用過程中遇到的問題和改進方式 1.2. 知識點 1.2.1. 模型例子 1. 我們在進行POST的請求的時候,尤其是增加一條數據,我們往往會有 ...
  • 一、引言 在學習集合的時候我們會發現一個問題,將一個對象丟到集合中後,集合併不記住對象的類型,統統都當做Object處理,這樣我們取出來再使用時就得強制轉換類型,導致代碼臃腫,而且加入集合時都是以Object,沒做類型檢查,那麼強制轉換就容易出錯,泛型的誕生就是為解決這些問題。 二、使用泛型 泛型是 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...