Python工具箱系列(三十九)_ZenDei技術網路在線

Python工具箱系列(三十九)

-Advertisement-

現實世界中，大量存在著對數據壓縮的需求。為此，python內置了zlib壓縮庫，可以方便的對任意對象進行壓縮。 ...

使用zlib對數據進行壓縮

現實世界中，大量存在著對數據壓縮的需求。為此，python內置了zlib壓縮庫，可以方便的對任意對象進行壓縮。

下述代碼演示了對字元串進行壓縮：

import zlib

# 壓縮一段中文
originstr = '神龜雖壽，猶有竟時；騰蛇乘霧，終為土灰。老驥伏櫪，志在千里；烈士暮年，壯心不已。盈縮之期，不但在天；養怡之福，可得永年。幸甚至哉，歌以詠志。'
print(len(originstr))
str_compression = zlib.compress(originstr.encode('utf-8'), level=8)
print(len(str_compression))
print(str_compression)
decompress_str = zlib.decompress(str_compression)
print(decompress_str)
print(decompress_str.decode('utf-8')) 

# 壓縮一段英文
originstr = 'The World Health Organization officially declared on Saturday that the current multi-country monkeypox outbreak outside of the traditional endemic areas in Africa has already turned into a public health emergency of international concern (PHEIC).'
print(len(originstr))
str_compression = zlib.compress(originstr.encode('utf-8'), level=8)
print(len(str_compression))
print(str_compression)
decompress_str = zlib.decompress(str_compression)
print(decompress_str)
print(decompress_str.decode('utf-8'))

運行上述代碼後，會發現壓縮並不一定會減少位元組數，壓縮的效率取決於壓縮內容中的冗餘程度。對於第一句的中文壓縮後反而增加了位元組數。但第二段英文則有明顯的壓縮比(246/180)。此外，在壓縮時不指定level則使用預設的壓縮級別（大約是6），是一個在速度與壓縮比間的平衡值。level的設定如下：

level=0，效果是不壓縮。
level=1,速度最快
level=9,速度最慢，壓縮比最高
level=-1，預設值
壓縮一個文件的操作類似，示例代碼如下：

import zlib

def compress(inputfile,outputfile):
    with open(inputfile,'rb') as input:
        with open(outputfile,'wb') as output:
            data = input.read()
            compressdata = zlib.compress(data)
            output.write(compressdata)

def decompress(inputfile,outputfile):
   with open(inputfile,'rb') as input:
        with open(outputfile,'wb') as output:
            data = input.read()
            compressdata = zlib.decompress(data)
            output.write(compressdata)

compress(r'd:\dev\sensor.dat',r'd:\dev\sensor.zlib')
decompress(r'd:\dev\sensor.zlib',r'd:\dev\sensor_d.dat')

使用vscode的hex editor可以打開三個文件如下圖所示：

首先源文件與壓縮解壓後的文件完全一樣。其次，壓縮後的文件確實小多了。最後可以看出，從某種意義上來說，壓縮也相當於加密。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Java中面向對象詳解

### 一.定義面向對象是:將事務高度抽象化的編程模式將問題分解成一個個小步驟，對每個步驟進行抽象，形成對象，通過不同的對象之間調用，組合解決問題。在進行面向對象進行編程時，要把屬性、行為等封裝成對象，然後基於這些對象及對象的能力進行業務邏輯的實現。創建一次，重覆使用 ### 二.面向對象三個 ...
RabbitMQ的安裝、配置和實戰

##### RabbitMQ安裝 ``` docker run -d --name xd_rabbit -e RABBITMQ_DEFAULT_USER=admin -e RABBITMQ_DEFAULT_PASS=password -p 15672:15672 -p 5672:5672 rabbi ...
關於自定義程式打包成jar包，並讀取配置

本文介紹從gitee下載nacos源碼，在本地編譯，並導入idea進行本地調試。 # 從gitee下載源碼由於github訪問速度慢，所以我選擇使用gitee的鏡像倉庫： ```shell git clone https://gitee.com/mirrors/Nacos.git ``` 本文使用 ...
暑假刷題記 B

## 動態規劃 ## 字元串 ## 雜題 #### [A:Animals and Puzzle](https://www.luogu.com.cn/problem/CF713D) #### [B:Vanya and Treasure](https://www.luogu.com.cn/problem ...
【pandas小技巧】--修改列的名稱

重命名 `pandas` 數據中列的名稱是一種常見的數據預處理任務。這通常是因為原始數據中的列名稱可能不夠清晰或準確。例如，列名可能包含空格、大寫字母、特殊字元或拼寫錯誤。使用 `pandas` 的 `rename`函數可以幫助我們更改列名，從而使數據更加清晰和易於理解。此外，重命名列名還可以確保 ...
秋葉整合包如何安裝Python包

前幾天寫了一篇《手把手教你在本機安裝Stable Diffusion秋葉整合包》的文章，有同學運行時遇到缺少Python Module的問題，幫助他處理了一下，今天把這個經驗分享給大家，希望能幫助到更多的同學。有時候啟動某些插件的時候會出現 ModuleNotFoundError 的提示，類似下圖 ...
瀏覽器中的自動化操作插件：Automa

相信很多小伙伴跟我一樣，每天都有大量基於瀏覽器的重覆操作，比如：查看任務、查看新聞、查看各種每天要關註的內容，甚至可能還需要對其做一些操作。那麼這些任務是否有辦法自動化執行呢？今天就給大家推薦一個瀏覽器擴展程式：**Automa**。Automa是一個開源的瀏覽器擴展，它可以基於瀏覽器來執行一些自 ...
使用pagehelper的坑(返回的total和size每頁條數一致的問題)

# 問題描述眾所周知，pagehelper使用時應該在dao查詢語句的前一句加上PageHelper.startPage,因為startpage是SQL攔截器，攔截它之後的第一個SQL,所以標題的問題由此引出…… # 原因 ### PageHelper.startPage使用後會將list隱性的給 ...