python3教程:json、pickle和sqlite3持久化存儲字典對象

来源:https://www.cnblogs.com/djdjdj123/archive/2022/06/23/16406513.html
-Advertisement-
Play Games

在各種python的項目中,我們時常要持久化的在系統中存儲各式各樣的python的數據結構,常用的比如字典等。尤其是在雲服務類型中的python項目中,要持久化或者臨時的在緩存中儲存一些用戶認證信息和日誌信息等,最典型的比如在資料庫中存儲用戶的token信息。在本文中我們將針對三種類型的python ...


在各種python的項目中,我們時常要持久化的在系統中存儲各式各樣的python的數據結構,常用的比如字典等。尤其是在雲服務類型中的python項目中,要持久化或者臨時的在緩存中儲存一些用戶認證信息和日誌信息等,最典型的比如在資料庫中存儲用戶的token信息。在本文中我們將針對三種類型的python持久化存儲方案進行介紹,分別是json、pickle和python自帶的資料庫sqlite3。

使用json存儲字典對象

json格式的數據存儲也是雲服務項目中常用的類型,具備十分輕量級和易使用的特性,這裡我們展示一個案例:如何使用json格式存儲一個用python產生的斐波那契數列。斐波那契數列中的每一個元素,都等於前一個數和前前一個數的和,即:
,而最常見的斐波那契數列的前兩位數都是1。如下是一個產生斐波那契數列的python代碼:

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]
print (number)

代碼的執行結果如下:

[[email protected] store_class]$ python3 json_dic.py 
{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

我們可以從結果中看到,第10個斐波那契數是55。接下來我們來看看這樣的一個字典,如何持久化的存儲到json格式的文件中,以下是一個使用的示例:

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:
    json.dump(number, file)

with open('number.json', 'r') as file:
    data = json.load(file)

print (data)

執行這個python文件,我們可以獲得如下所示的輸出:

[[email protected] store_class]$ python3 json_dic.py 
{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}

這裡我們發現在當前目錄下產生了一個json的文件:

[[email protected] store_class]$ ll
總用量 8
-rw-r--r-- 1 dechin dechin 265  3月 20 12:32 json_dic.py
-rw-r--r-- 1 dechin dechin  85  3月 20 12:32 number.json

我們可以看一下這個json文件中存儲了什麼樣的數據:

[[email protected] store_class]$ cat number.json 
{"1": 1, "2": 1, "3": 2, "4": 3, "5": 5, "6": 8, "7": 13, "8": 21, "9": 34, "10": 55}

在驗證了相關的數據已經被持久化存儲了之後,同時我們也註意到一個問題,我們產生斐波那契數列的時候,索引1,2,3...

使用的是整型變數,但是存儲到json格式之後,變成了字元串格式。我們可以使用如下的案例來說明這其中的區別:

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:
    json.dump(number, file)

with open('number.json', 'r') as file:
    data = json.load(file)

print (data)
print (number[10])
print (data['10'])
print (data[10])

執行的輸出如下:

[[email protected] store_class]$ python3 json_dic.py 
{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}
55
55
Traceback (most recent call last):
  File "json_dic.py", line 16, in <module>
    print (data[10])
KeyError: 10

這裡的輸出就有一個報錯信息,這是因為我們使用了整型索引變數來尋找json存儲的字典對象中對應的值,但是因為前面存儲的時候這些整型的索引已經被轉換成了字元串的索引,因此實際上在存儲的對象中已經不存在整型的鍵值,所以執行結果會報錯,而如果輸入的是字元串類型的鍵值,則成功的找到了第10個斐波那契數。

使用pickle存儲字典對象

關於斐波那契數列的信息,在上一章節中已經介紹,這裡我們直接進入pickle的使用案例:

import pickle
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:
    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:
    data = pickle.load(file)

print (data)

這裡註意一個細節,在json格式的存儲中我們使用的文件打開格式是w,而在pickle這裡我們使用的存儲文件打開格式是wb,pickle的讀取也是用的rb的二進位的讀取格式。上述代碼的執行輸出結果如下:

[[email protected] store_class]$ python3 pickle_dic.py 
{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

這裡我們可以發現,由pickle所存儲的字典格式中的整型的索引也被成功的存儲起來,在當前目錄下產生了一個名為number.pickle的文件就是持久化存儲的對象。

[[email protected] store_class]$ ll
總用量 12
-rw-r--r-- 1 dechin dechin 320  3月 20 12:45 json_dic.py
-rw-r--r-- 1 dechin dechin  85  3月 20 12:46 number.json
-rw-r--r-- 1 dechin dechin  56  3月 20 12:44 number.pickle
-rw-r--r-- 1 dechin dechin 279  3月 20 12:44 pickle_dic.py

類似於json格式中的持久化讀取驗證,我們也可以簡單修改一個類似的pickle的案例:

import pickle
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:
    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:
    data = pickle.load(file)

print (data)
print (number[10])
print (data[10])

執行結果如下所示:

{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}
55
55

從結果中我們發現存儲後的對象用一樣的讀取格式被成功讀取。

使用sqlite3存儲字典對象

在常用的Linux操作系統中都會自帶sqlite3資料庫,如果是windows和Mac的操作系統,可以按照這個教程中給的方案進行安裝。

SQLite是一個進程內的庫,實現了自給自足的、無伺服器的、零配置的、事務性的 SQL 資料庫引擎。它是一個零配置的資料庫,這意味著與其他資料庫不一樣,您不需要在系統中配置。

就像其他資料庫,SQLite引擎不是一個獨立的進程,可以按應用程式需求進行靜態或動態連接。SQLite直接訪問其存儲文件。
在這裡插入圖片描述
同時在python3的庫中一般也自帶了sqlite3,不需要自己安裝,下麵我們用ipython演示一下如何在python中使用sqlite3資料庫:

[[email protected] store_class]$ ipython
Python 3.8.5 (default, Sep  4 2020, 07:30:14) 
Type 'copyright', 'credits' or 'license' for more information
IPython 7.19.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import sqlite3

In [2]: conn = sqlite3.connect('test_sqlite3.db') # 如果有db文件就讀取,沒有就創建

In [3]: cur = conn.cursor()

In [8]: sql_test_1 = '''CREATE TABLE number
   ...:         (i NUMBER,
   ...:          n NUMBER);''' # 創建一個名為number的表,有兩列數據i和n作為鍵值對

In [9]: cur.execute(sql_test_1) # 執行字元串指令
Out[9]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [10]: sql_test_2 = "INSERT INTO number VALUES(1,1)" # 插入新的數據

In [11]: cur.execute(sql_test_2)
Out[11]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [12]: sql_test_2 = "INSERT INTO number VALUES(2,1)"

In [13]: sql_test_3 = "INSERT INTO number VALUES(2,1)"

In [14]: cur.execute(sql_test_3)
Out[14]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [15]: sql_test_4 = "SELECT * FROM number WHERE i=1" # 檢索數據

In [16]: cur.execute(sql_test_4)
Out[16]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [17]: cur.fetchall()
Out[17]: [(1, 1)]

In [18]: sql_test_5 = "SELECT * FROM number WHERE i>=1"

In [19]: cur.execute(sql_test_5)
Out[19]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [20]: cur.fetchall() # 讀取檢索返回值
Out[20]: [(1, 1), (2, 1)]

In [21]: for i in range(3, 11):
    ...:     sql_test_6 = "SELECT * FROM number WHERE i={}".format(i-1)
    ...:     cur.execute(sql_test_6)
    ...:     select_result1 = cur.fetchall()[0][1]
    ...:     sql_test_7 = "SELECT * FROM number WHERE i={}".format(i-2)
    ...:     cur.execute(sql_test_7)
    ...:     select_result2 = cur.fetchall()[0][1]
    ...:     cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1+select_res
    ...: ult2))
    ...: 

In [22]: sql_test_8 = "SELECT * FROM number WHERE i>=1"

In [23]: cur.execute(sql_test_8)
Out[23]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [24]: cur.fetchall()
Out[24]: 
[(1, 1),
 (2, 1),
 (3, 2),
 (4, 3),
 (5, 5),
 (6, 8),
 (7, 13),
 (8, 21),
 (9, 34),
 (10, 55)]

In [25]: exit() # 退出ipython

在上述示例中我們演示瞭如何使用sqlite3創建資料庫和表,以及對錶的內容的一些常用操作。在執行完上述示例後,會在當前目錄下產生一個新的db文件:

[[email protected] store_class]$ ll
總用量 24
-rw-r--r-- 1 dechin dechin  320  3月 20 12:45 json_dic.py
-rw-r--r-- 1 dechin dechin   85  3月 20 12:46 number.json
-rw-r--r-- 1 dechin dechin   56  3月 20 12:47 number.pickle
-rw-r--r-- 1 dechin dechin  315  3月 20 12:47 pickle_dic.py
-rw-r--r-- 1 dechin dechin 8192  3月 20 13:05 test_sqlite3.db

如果在運行過程中出現如下所示的報錯,就代表有其他的進程正在占用這個db文件,因此會有進程將這個資料庫進行鎖定:

Traceback (most recent call last):
  File "sqlite3_dic.py", line 15, in <module>
    cur.execute("INSERT INTO number VALUES(1,1)")
sqlite3.OperationalError: database is locked

解決的辦法是,首先用fuser查看這個db文件被哪個用戶所占用:

[[email protected] store_class]$ fuser test_sqlite3.db 
/home/dechin/projects/2021-python/store_class/test_sqlite3.db:  5120

我們查看到是5120這個進程占用了資料庫文件,也是這個進程將資料庫鎖定了。通常這種情況出現的原因是,在python中執行的資料庫操作指令未成功完成,導致資料庫的進程沒有結束,而我們也無法再通過這個進程向資料庫中輸入新的指令。因此我們只能通過將該進程殺死的方案來解決這個問題:

[[email protected] store_class]$ kill -9 5120

還有一個需要註意的點是,上面所用到的資料庫操作實際上並未真正的被保存到資料庫文件中,需要經過commit之後才會被保存到資料庫文件中。接下來我們還是用斐波那契數列的例子來演示資料庫操作的使用:

import sqlite3
from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')
cur = conn.cursor()
try:
    sql_test_1 = '''CREATE TABLE number
                    (i NUMBER,
                     n NUMBER);'''
    cur.execute(sql_test_1)
except:
    pass
cur.execute("INSERT INTO number VALUES(1,1)")
cur.execute("INSERT INTO number VALUES(2,1)")
for i in trange(3, 11):
    sql_test_6 = "SELECT * FROM number WHERE i={}".format(i - 1)
    cur.execute(sql_test_6)
    select_result1 = cur.fetchall()[0][1]
    sql_test_7 = "SELECT * FROM number WHERE i={}".format(i - 2)
    cur.execute(sql_test_7)
    select_result2 = cur.fetchall()[0][1]
    cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1 + select_result2))

cur.execute("SELECT * FROM number WHERE i=10")
print (cur.fetchall())
conn.commit()
cur.close()
conn.close()

在上述用例中我們補充了commit操作和close操作,一方面持久化的保存了數據,另一方面也避免因為程式中其他地方的問題而導致了前面所提到的資料庫被鎖定的問題。我們看一下這個用例的執行輸出情況:

[[email protected] store_class]$ python3 sqlite3_dic.py 
100%|█████████████████████████████████████████████████████████| 8/8 [00:00<00:00, 31775.03it/s]
[(10, 55)]

第10個斐波那契數被成功輸出,在資料庫的輸出中,使用的格式是一個列表包含多個元組的形式。其中每一個元組代表一個滿足檢索條件的鍵值對,每一個元組中的元素代表每一列的值。

前面提到了持久化保存的問題,我們也用一個簡單示例來驗證剛纔經過commit之後是否被成功的保存起來了:

'''
學習中遇到問題沒人解答?小編創建了一個Python學習交流群:153708845
尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書!
'''
import sqlite3
from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')
cur = conn.cursor()
cur.execute("SELECT * FROM number WHERE i=10")
print (cur.fetchall())
conn.commit()
cur.close()
conn.close()

執行輸出如下:

[[email protected] store_class]$ python3 test_recall_sqlite3.py 
[(10, 55)]

這個結果表明前面存儲下來的斐波那契數列已經被持久化的保存到了資料庫文件中,我們只要鏈接上該資料庫就可以隨時的讀取該數據。

總結

本文介紹了三種python的字典對象持久化存儲方案,包含json、pickle和資料庫sqlite,並且配合一個實際案例斐波那契數列來演示了不同解決方案的使用方法。這裡三種方案實際上各有優劣,推薦的使用場景為:在輕量級、日常使用中可以重點使用json格式進行對象的存儲,我們也可以很方便的在系統上直接查看json格式的文件內容;在多用戶或多進程使用的案例中,推薦使用pickle的方案,可以更高性能、更低開銷的持久化存儲python對象;如果是需要對外提供服務的,我們推薦可以直接使用sqlite,對外可以提供一個資料庫查詢的解決方案,便不需要在本地存儲大量的數據或者可以更方便的對大規模數據進行處理。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、前言 小編最近開始學習typescript,懂得人都知道,typescript是vue3的基礎伴生,配合更加默契。就像vue2和js一樣!typescript不像js那樣瀏覽器直接可以解讀,需要我們把ts文件編譯成js文件,這樣瀏覽器才可以解讀。所以我們要安裝一下ts的環境和自動編譯,方便我們後 ...
  • 前言 : 組件系統是Vue.js其中一個重要的概念,它提供了一種抽象,讓我們可以使用獨立可復用的小組件來構建大型應用,任意類型的應用界面都可以抽象為一個組件樹。 現在基於vue的UI組件庫有很多,比如iview,element-ui等。但有時候這些組件庫滿足不了我們的開發需求,這時候我們就需要自己寫 ...
  • 1 前言 在嵌入式MCU軟體開發過程中,程式分層設計也是重中之重,關係到整個軟體開發過程中的協同開發,降低系統軟體的複雜度(複雜問題分解)和依賴關係、同時有利於標準化,便於管理各層的程式,提高各層邏輯的復用等。 2 分層介紹 2.1 硬體抽象層(HAL) 嵌入式開發的核心就是晶元,它提供固定的片內資 ...
  • 目錄 一.簡介 二.效果演示 三.源碼下載 四.猜你喜歡 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 基礎 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 轉場 零基礎 O ...
  • 前言 回歸分析就是用於預測輸入變數(自變數)和輸出變數(因變數)之間的關係,特別當輸入的值發生變化時,輸出變數值也發生改變!回歸簡單來說就是對數據進行擬合。線性回歸就是通過線性的函數對數據進行擬合。機器學習並不能實現預言,只能實現簡單的預測。我們這次對房價關於其他因素的關係。 波士頓房價預測 下載相 ...
  • 迎面走來了你的面試官,身穿格子衫,挺著啤酒肚,髮際線嚴重後移的中年男子。 手拿泡著枸杞的保溫杯,胳膊夾著MacBook,MacBook上還貼著公司標語:“我愛加班”。 面試開始,直入正題。 面試官: 你知道MySQL索引底層數據結構為啥用B+樹?而不用B樹、紅黑樹或者普通二叉樹? 我: 這事誰知道作 ...
  • 簡介 是什麼? 確保應用能夠在這些環境中運行和通過質量檢測.並且在部署過程中不出現令人頭疼的版本、配置問題,也無需重新編寫代碼和進行故障修複. Docker之所以發展如此迅速,也是因為它對此給出了一個標準化的解決方案 系統平滑移植,容器虛擬化技術。 解決了運行環境和配置問題的軟體容器,方便做持續集成 ...
  • 二、讀寫分離案例 2.1、背景介紹 面對日益增加的系統訪問量,資料庫的吞吐量面臨著巨大瓶頸,對於同一時刻有大量併發讀操作和較少寫操作類型的應用系統來說,將資料庫拆分為主庫和從庫,主庫負責處理事務性的增刪改操作,從庫負責處理查詢操作,這樣可以有效地避免由數據更新導致的行鎖,使得整個系統的查詢性能得到極 ...
一周排行
    -Advertisement-
    Play Games
  • 記錄一下Winform程式打包過程 參考文章:VS2017 WinFrom打包設置與教程 下載 Visual Studio Installer 拓展插件 從VS2017開始VS已預設不再集成Installer拓展,所以需要手動下載安裝,在 工具 - 插件和更新 裡面的插件商店裡面搜索"install ...
  • 先下載一個gif圖片,這裡提供一個gif圖片示例 線上GIF圖片幀拆分工具 - UU線上工具 (uutool.cn) 使用這個網站將gif切成單張圖片 創建一個Avalonia MVVM的項目,將圖片copy進去 在項目文件中添加一下代碼: <ItemGroup> <None Update="gif ...
  • 1 簡介 Dapr是一個可移植的、事件驅動的運行時,它使任何開發人員能夠輕鬆構建出彈性的、無狀態和有狀態的應用程式,並可運行在雲平臺或邊緣計算中,它同時也支持多種編程語言和開發框架。Dapr支持的語言很多,包括C++/Go/Java/JavaScript/Python/Rust/.NET/PHP等。 ...
  • 作者:大眼睛圖圖 鏈接:https://juejin.cn/post/7156483709338648613 前言 還有誰?剛上三天班就被公司公司的工作不適合我,叫我先提升一下。 後面我也向公司那邊討要了一個說法,我只能說他們那邊的說辭讓我有些不服氣。 現在之所以把這件事在掘金上記錄一下,一是記錄一 ...
  • 雲原生下的流水線是通過啟動容器來運行具體的功能步驟,每次運行流水線可能會被調度到不同的計算節點上。這會導致一個問題:容器運行完是不會保存數據的,每當流水線重新運行時,又會重新拉取代碼、編譯代碼、下載依賴包等等。在雲原生場景下,不存在本地宿主機編譯代碼、構建鏡像時緩存的作用,大大延長了流水線運行時間,... ...
  • 本文介紹基於Python語言中TensorFlow的tf.estimator介面,實現深度學習神經網路回歸的具體方法。 () 1 寫在前面 1. 本文介紹的是基於TensorFlow tf.estimator介面的深度學習網路,而非TensorFlow 2.0中常用的Keras介面;關於Keras接 ...
  • 基礎 我是在ruoyi-vue已經安裝了mybatis-plus的基礎上進行的修改 關於SQLite SQLite 是一個軟體庫,實現了自給自足的、無伺服器的、零配置的、事務性的 SQL 資料庫引擎。 SQLite主頁:https://www.sqlite.org/index.html 1. pom ...
  • 1. 服務監控三要素^1 服務監控需要滿足的三要素分別如下: 日誌監控 指標監控 請求鏈路追蹤 服務監控只要能滿足這三個要素,基本就能實現我們想要的監控效果。 1.1.主流APM系統^1 APM 系統(Application Performance Management,即應用性能管理)是對企業的應 ...
  • 雙重檢查鎖定與延遲初始化 在 java 程式中,有時候可能需要推遲一些高開銷的對象初始化操作,並且只有在使用這些對象時才進行初始化。此時程式員可能會採用延遲初始化。但要正確實現線程安全的延遲初始化需要一些技巧,否則很容易出現問題。比如,下麵是非線程安全的延遲初始化對象的示例代碼: COPYpubli ...
  • 顧名思義單調棧就是具有單調性的棧 ==常見模型:找出每個數左邊離它最近的比它大/小的數== 【演算法】 int stk[N],tt = 0; // 棧中存數據 for (int i = 1; i <= n; i ++){ int x; cin >> x; while (tt && stk[tt] >= ...