### 拾取和解除拾取 對象的序列化是將對象轉換為比特形式的方法,這樣我們就可以在硬碟上保存對象的狀態。儘管許多語言都為我們提供了對象序列化的方式,但Python在所有的語言中更加靈活。 在Python中,對象序列化被稱為pickling,而去序列化被稱為unpickling。我們在 Python ...
拾取和解除拾取
對象的序列化是將對象轉換為比特形式的方法,這樣我們就可以在硬碟上保存對象的狀態。儘管許多語言都為我們提供了對象序列化的方式,但Python在所有的語言中更加靈活。
在Python中,對象序列化被稱為pickling,而去序列化被稱為unpickling。我們在 Python 中大多使用對象。因此,我們幾乎可以對所有的東西進行序列化/非序列化。然而,在使用它之前,不可避免地要小心,必須知道 pickling 的目的。
在進入理論細節之前,讓我們用Pickle模塊演示一下Python中的pickling。
在Python中進行腌制
對於pickling,首先,導入pickle 模塊。
import pickle
我們可以在Python中序列化幾乎任何對象。讓我們拿一個字典對象來做示範。
bio_dict = {
'name': 'Zohaib',
'age': 29,
'profession': 'Engineer'
}#Python小白學習交流群:711312441
pickle 包含 函數來序列化該對象。.dump()
with open('bio_dict.pickle', 'wb' ) as file_name:
pickle.dump(bio_dict, file_name)
在上面的代碼中,我們打開了一個有寫許可權的文件bio_dict.pickle (即wb),然後用.dump() 函數將bio_dict 字典腌制到腌制文件中。結果,我們成功地將字典轉換為位元組流格式。
在 Python 中解除腌制
當需要再次使用腌制的對象時,可以對它進行反序列化。為此,我們可以使用pickle.load() 函數,正如下麵的代碼所演示的:
with open('bio_dict.pickle', 'rb' ) as file_name:
unpickled_dict =pickle.load(file_name)
print("The retrieved dictionary is: ", unpickled_dict)
我們打開之前保存的(.pickle)文件,然後使用.load() 函數再次獲取對象。上面的代碼產生了以下輸出。
The retrieved dictionary is: {'name': 'Zohaib', 'age': 29, 'profession': 'Engineer'}
我們可以用下麵的代碼檢查腌制和未腌制的對象是否相等。
assert bio_dict==unpickled_dict
腌制的優勢和劣勢
以下是Python中腌制的優點:
-
幾乎任何Python對象都可以用Python中的這個pickle 模塊進行序列化,不像JSON 和其他序列化技術。
-
我們以後可以使用腌制的對象。例如,如果你做了一個大型的計算,並且腌制了對象。那麼,下次當你開始一個新的Python會話時,你不需要再做以前完成的大型計算。
-
相反,你把腌制的對象解開,在新的計算中使用它們。這樣,我們可以節省時間和資源。
-
腌制的對象可以有效地被多個線程讀取,從而實現快速的並行計算。
腌制有多種後果。在使用pickling之前,你應該意識到它們。
- 我們不應該解開從不可靠的來源收集的數據。它可能包含被篡改的數據或一些任意脆弱的代碼,可能導致嚴重的安全問題。
- 與JSON 文件不同,腌制文件不是人類可以閱讀的。
- JSON 文件可以被多種語言所使用和支持。另一方面,Python中的pickle文件可能不被許多語言所支持,你可能需要相關的第三方中介庫來作為適配器。
還有什麼可以被腌制
這是一個重要的問題,需要很多時間來描述。但是,簡而言之,你可以腌制許多Python的東西,比如函數、Pandas 數據框,以及其他許多東西。
Pickle也是一個對機器學習非常有幫助的工具,因為它可以讓你保存你的模型,減少耗時的再訓練,以及分享、提交和重新載入以前訓練的模型。
你可以按照這個指南使用pickle來存儲你的機器學習模型。