【pyhon筆記】錢跡x信用卡輔助對賬(個人用)

来源:https://www.cnblogs.com/yiusnow/archive/2023/03/04/17179108.html
-Advertisement-
Play Games

背景 記賬強迫症患者,苦於賬本上的信用卡額度總跟實際的對不上,python小白的我決定寫個小demo輔助對賬。 涉及 python BeautifulSoup SQLite 準備 信用卡賬單eml(這裡用的J行) 錢跡賬單csv 關鍵步驟 解析並處理信用卡賬單 使用BeautifulSoup組件,解 ...


背景

記賬強迫症患者,苦於賬本上的信用卡額度總跟實際的對不上,python小白的我決定寫個小demo輔助對賬。

涉及

  • python BeautifulSoup
  • SQLite

準備

  • 信用卡賬單eml(這裡用的J行)
  • 錢跡賬單csv

關鍵步驟

解析並處理信用卡賬單

使用BeautifulSoup組件,解析賬單eml
    # 讀取賬單eml
    eml = open(source_path).read()
    # 使用Parser解析eml
    content = Parser().parsestr(eml)
    bill = ""
    # 深度優先遍歷
    for par in content.walk():
        # 消息的有效內容是一個子EmailMessage對象的列表,則返回True,否則返回False
        if not par.is_multipart():
            content = par.get_payload(decode=True)
            if len(content.strip()) != 0:
                # 這裡,會得到唯一的一個包含賬單的html字元串
                bill = content.decode(encoding='gbk')
    # 這裡需要重點註意
    # 使用BeautifulSoup轉化前,需要事先將換行符去掉
    # 否則,帶有換行符節點的標簽對象會解析不出來,直接變成None
    data = BeautifulSoup(bill.replace('<br>', '').replace('<br/>', ''), "html.parser")
搜索賬單列表。通過分析賬單,還款明細的開頭如下所示是一個id為takeList的tbody
<tbody id=takeList>

然後,這個tbody還會包含一個唯一的tbody,這個tbody下麵就是一條一條的還款明細了

# 得到還款明細列表
repayList = data.find("tbody", id="repayList").find("tbody")

同理,也能得到消費列表

takeList = data.find("tbody", id="takeList").find("tbody")
逐條解析消費明細,得到交易列表
    bills = []
    repayAmount = Decimal(0.00)
    for repay in repayList.children:
        # NavigableString類型,就是沒有子節點的字元串
        # BeautifulSoup會將註釋也解析進去,主要就是為了排除註釋
        if not isinstance(repay, NavigableString):
            bill = {}
            bill["type"] = "repay"
            for item in repay.children:
                # 匹配日期 MM/dd
                if re.match("\d\d/\d\d", str(item.string), flags=0):
                    bill["time"] = year + "-" + str(item.string).replace("/", "-")
                # 匹配金額
                elif re.match("CNY\d*\.\d*", str(item.string), flags=0):
                    amount = str(item.string)[3:]
                    bill["amount"] = amount
                    repayAmount += Decimal(float(amount))
            bills.append(bill)

為了之後方面對賬,就將上面的數據處理成瞭如下所示格式

{
    "month": "2023-02",
    "name": "信用卡08月",
    "bills": {
        "2022-02-22": [{
            "type": "repay",
            "channel": "BCM",
            "time": "2022-02-22",
            "amount": "2.00"
        }]
    },
    "size": 1,
    "start": "17"
}

處理錢跡賬單

導入SQLite

為了方便搜索數據,我用錢跡賬單csv生成了SQLite資料庫文件

搜索錢跡數據
    current = current + relativedelta(days=1)
    endtime = current.strftime("%Y-%m-%d") + " 00:00:00"
    conn = sqlite3.connect(db_dir)
    cur = conn.cursor()      
    cur.execute("select *from qian_ji qj where 時間 >= '" + starttime + "' and 時間 < '" + endtime + "' and 賬戶1 ='" + 賬戶名稱 + "'")
比對數據

因為信用卡的賬單是一個月一個,所以我這邊也是一次比對一個月。
從賬單日第一天開始,一直到下個月的賬單日前一天,逐日分別計算當天信用卡和錢跡的交易凈值並比對

感想

算是花了不少時間,實際最後也沒做出啥像樣的東西,但至少整個過程下來,也是學到了不少東西。
至少,目的達成了————成功阻止了我自己手動去改賬本上的賬戶金額。
後續再繼續研究下其他渠道的賬單。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、全局排序(Order by) 功能:全局排序,只有1個reducer(用1個Reduce Task完成全局排序,與設置的Reduce Task個數無關) 參數:ASC:升序(預設) DESC:降序 使用:order by放在select語句的結尾 例如: --查詢員工信息按工資降序排列 sele ...
  • 前言 本文是關於使用flutter_download_manager下載功能的實踐和探索。我們將基於flutter_download_manager的功能擴展,改造成自己想要的樣子。在閱讀本文之前,建議先瞭解前兩篇文章: Flutter 下載篇 - 壹 | flutter_download_mana ...
  • 需求背景 繼上篇《Flutter 下載篇 - 壹 | flutter_download_manager 源碼解析》中詳細介紹了 flutter_download_manager 用法和原理。在優缺點中提到,該庫純 Dart 實現,支持下載管理,暫停,恢復,取消和斷點續傳。其中有個缺點是網路庫與 di ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 前言 在開發管理後臺過程中,一定會遇到不少了增刪改查頁面,而這些頁面的邏輯大多都是相同的,如獲取列表數據,分頁,篩選功能這些基本功能。而不同的是呈現出來的數據項。還有一些操作按鈕。 對於剛開始只有 1,2 個頁面的時候大多數開發者可能會直 ...
  • 本文檔是從官網文檔中摘錄的一些重點內容,以及加入了自己的一些調整和對官網內容的理解和解釋。適合新手學習,有一定技術水平的寶子,建議直接查看 [NUXT英文官網] ...
  • 項目介紹+SSM環境搭建 1.項目功能/界面 SSM整合項目界面:使用Vue完成 技術棧:前後端分離開發,前端框架Vue3+後端框架SSM 前端框架-Vue3 後端框架-SSM(SpringMVC+Spring+MyBatis) 資料庫-MySQL 項目依賴管理-Maven 分頁-pagehelpe ...
  • 距離上次學Python寫的Python實現簡單聊天室已經過去好久了,現在學c++又寫了一遍,其實過程差不多,無非是語法的變化,目前僅實現最簡單的一對一的通信,然後改就是了,接下來應該是多線程了,話不多說直接貼上源碼; 一、服務端源碼 #include <stdio.h> #include <arpa ...
  • 詳細代碼如下: package main import ( "fmt" "strings" ) func main() { s := "1w1w2d2d3d3d4w4w3w3w7d7d8d8d" mj := InitMahjong(s) mj.Print() fmt.Println(mj.Win() ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...