使用Python監聽並下載微信聊天表情包

来源:https://www.cnblogs.com/kanadeblisst/p/17974469
-Advertisement-
Play Games

實現的功能 只要有人給你發了表情包,不管是群聊還是個人發的,都將它保存到本地。也許某天鬥圖的時候就能用到,不過即使有了表情包,還需要一個檢索功能,不然這一張一張看也太費眼睛了。 檢索表情包 檢索表情包的功能實現比較麻煩,至少需要兩個模型:ocr和圖片描述生成,如果更複雜點的話還需要分詞演算法、資料庫等 ...


實現的功能

只要有人給你發了表情包,不管是群聊還是個人發的,都將它保存到本地。也許某天鬥圖的時候就能用到,不過即使有了表情包,還需要一個檢索功能,不然這一張一張看也太費眼睛了。

檢索表情包

檢索表情包的功能實現比較麻煩,至少需要兩個模型:ocr和圖片描述生成,如果更複雜點的話還需要分詞演算法、資料庫等。

需要ocr應該很容易理解,表情包裡面包含文字信息,使用ocr將文字提取出來,這個文字基本就可以作為檢索的信息了。

如果表情沒有文字,那隻能使用一些模型,為圖片生成一個簡單的描述,然後將這個描述作為檢索的信息。

搜了一下目前開源的模型裡面沒看到比較合適的。後面如果遇到了再做一個簡單的表情包檢索程式。

開始實現

效果圖

github代碼

https://github.com/kanadeblisst00/WeChat-PyRobot

http://www.pygrower.cn:21180/kanadeblisst/WeChat-PyRobot

實現原理

使用Python來監聽微信消息,如果收到表情包消息就提取裡面的鏈接並下載,因為表情包xml消息里有一個未加密的鏈接。

監聽消息的原理和代碼可以看之前的一篇文章: 【Python微信機器人】第八篇: 實戰32位和64位接收消息和消息防撤回

代碼在上篇文章的基礎上做瞭如下優化:

  1. 使用隊列存儲監聽到的消息
  2. 支持載入消息插件來處理消息
  3. 支持註入後就自動監聽消息

待實現插件列表

  • 監聽群聊中的群二維碼
  • 監聽並實時採集關註的公眾號文章
  • 自動下載並解密聊天中的圖片
  • chatgpt自動回覆
  • 群消息關鍵詞提醒
  • 消息保存到資料庫,如sqlite、postgresql等
  • 自動接收轉賬
  • 監聽收款信息對接發卡平臺,目前可以用v免簽+獨角數卡

開始監聽並下載表情包

準備工作

  1. 安裝支持的版本微信(目前只寫了3.9.8.123.9.8.15的代碼)
  2. 安裝32位或64位Python(取決於你安裝的微信是32位還是64位),Python版本需大於等於3.8
  3. pip install wechat_pyrobot==1.1.1

如果國內源還沒有同步最新版本,可以指定-i https://pypi.org/simple/選項使用pip官方庫

開始監聽消息

先啟動並登錄微信,隨便創建一個文件夾,然後創建一個文件main.py(名稱隨意)寫入以下代碼:

from py_process_hooker import inject_python_and_monitor_dir
from wechat_pyrobot import get_on_startup
from wechat_pyrobot.msg_plugins import PrintMsg, DownLoadEmotion


if __name__ == "__main__":
    process_name = "WeChat.exe"
    open_console = True
    on_startup = get_on_startup(msg_plugins=[PrintMsg, DownLoadEmotion])
    
    inject_python_and_monitor_dir(process_name, __file__, open_console=open_console, on_startup=on_startup)

使用Python運行這段代碼,就會將Python註入到微信,並且開始監聽微信收到的消息,然後將監聽到的消息依次傳遞給msg_plugins指定的插件列表。

DownLoadEmotion插件就是用來下載表情包的,裡面的代碼很簡單:

class DownLoadEmotion(MsgPluginTemplate):
    def __init__(self, **kwargs) -> None:
        self.name = os.path.basename(__file__)[:-3]
        super().__init__(**kwargs)
        self.emotion_save_path = os.path.join(kwargs["pwd"], "emotion")
        os.makedirs(self.emotion_save_path, exist_ok=True)

    def deal_msg(self, msg_dict):
        if msg_dict["msg_type"] != 0x2F:
            return
        xml = msg_dict["content"]
        root = ET.fromstring(xml) 
        datas = dict(root.find('.//emoji').items())
        cdnurl = datas["cdnurl"].replace('&', '&')
        filename = msg_dict["file_path"]
        if not filename:
            filename = msg_dict["msgid"]
        save_path = f"{self.emotion_save_path}{os.sep}{filename}.gif"
        with open(save_path, 'wb') as f:
            f.write(self.download_file(cdnurl))
    
    def download_file(self, url, retry=0):
        if retry > 2:
            return
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.183"
        }
        try:
            resp = requests.get(url, headers=headers, timeout=6)
        except:
            traceback.print_exc()
            time.sleep(2)
            return self.download_file(url, retry+1)
        return resp.content

先判斷一下消息類型是不是0x2F,也就是表情包的消息類型,然後提取xml數據里的cdnurl,用requests下載下來保存到本地

編寫自己的插件

可以先參考目前已有的插件例子,代碼在wechat_pyrobot/msg_plugins, 在github或者pip本地目錄都可以看到

編寫一個消息保存到文件的插件

插件需要繼承MsgPluginTemplate,然後實現deal_msg方法,方法只有一個參數:字典類型的消息

my_msg_plugin/save_to_file.py

import os
import json
from wechat_pyrobot.plugin_class import MsgPluginTemplate


class SaveToFile(MsgPluginTemplate):
    def __init__(self, **kwargs) -> None:
        self.name = os.path.basename(__file__)[:-3]
        super().__init__(**kwargs)
        # kwargs["pwd"]是main.py所在路徑
        self.msg_save_path = os.path.join(kwargs["pwd"], "msg_save_path")
        os.makedirs(self.msg_save_path, exist_ok=True)
    
    def deal_msg(self, msg_dict):
        path = os.path.join(self.msg_save_path, f'{msg_dict["msgid"]}.json')
        with open(path, 'w', encoding='utf-8') as f:
            f.write(json.dumps(msg_dict)) 

然後在註入的代碼(main.py)裡加載它,需要重新啟動並註入微信

from py_process_hooker import inject_python_and_monitor_dir
from wechat_pyrobot import get_on_startup
from wechat_pyrobot.msg_plugins import PrintMsg, DownLoadEmotion
from my_msg_plugin.save_to_file import SaveToFile

if __name__ == "__main__":
    process_name = "WeChat.exe"
    open_console = True
    on_startup = get_on_startup(msg_plugins=[PrintMsg, DownLoadEmotion, SaveToFile])
    
    inject_python_and_monitor_dir(process_name, __file__, open_console=open_console, on_startup=on_startup)

這樣收到的消息都會保存到文件,當然這個只是示例。實際應該按時間來分類文件,或者保存到資料庫中。

插件列表是有順序的,在執行時會依次執行,如果之前的插件修改了消息字典,那麼之後的插件得到的消息字典就是修改後的

本文由博客一文多發平臺 OpenWrite 發佈!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在接入小程式過程中會遇到需要將 H5 頁面集成到小程式中情況,今天我們就來聊一聊怎麼把 H5 頁面塞到小程式中。 本篇文章將會從下麵這幾個方面來介紹: 小程式承載頁面的前期準備 小程式如何承載 H5 小程式和 H5 頁面如何通訊 小程式和 H5 頁面的相互跳轉 小程式承載頁面的前期準備 首先介紹下我 ...
  • Vue3 對 diff 過程進行了大升級,利用 最長遞增子序列演算法 去計算最少移動dom,儘可能少的做移動節點位置操作! ...
  • 在當今的互聯網時代,微服務架構已經成為許多企業選擇的架構模式,它能夠提高系統的靈活性、可維護性和可擴展性。然而,微服務架構下的高可用性和彈性擴展是一個複雜的挑戰。本文將介紹如何利用容器與中間件來實現微服務架構下的高可用性和彈性擴展的解決方案。 ...
  • 嗨,大家好!歡迎來到C-Shopping,這是一場揭開科技面紗的電商之旅。我是C-Shopping開源作者“繼小鵬”,今天將為你介紹一款基於最新技術的開源電商平臺。讓我們一同探索吧! 點擊 這裡,http://shop.huanghanlian.com/,即刻踏上C-Shopping 體驗之旅! 項 ...
  • 小北說在前面: 在一線互聯網企業種,如網易、美團、位元組、如阿裡、滴滴、極兔、有贊、希音、百度、美團等大廠,資料庫的面試題,一直是核心和重點的提問點,比如前段時間有位小伙伴面試位元組,就遇到了下麵這道面試題: 索引的設計規範,你知道那些? 小伙伴雖然用過索引,但是索引的設計規範忘記得一干二凈,回答也是朦 ...
  • 目錄用 panic! 處理不可恢復的錯誤對應 panic 時的棧展開或終止使用 panic! 的 backtraceWindows設置 RUST_BACKTRACE 環境變數的兩種方式用 Result 處理可恢復的錯誤匹配不同的錯誤不同於使用 match 和 Result<T, E>失敗時 pani ...
  • 前言 使用opencv對圖像進行操作,要求:(1)定位銀行票據的四條邊,然後旋正。(2)根據版面分析,分割出小寫金額區域。 圖像校正 首先是對圖像的校正 讀取圖片 對圖片二值化 進行邊緣檢測 對邊緣的進行霍夫曼變換 將變換結果從極坐標空間投影到笛卡爾坐標得到傾斜角 根據傾斜角對主體校正 import ...
  • tomcat安裝 1.下載安裝apache-tomcat 官方網站: https://tomcat.apache.org/ 1.1主頁直接下載 選擇要下載的版本 選擇自己電腦符合的版本,32位的應該不常見了,直接64 另存即可 1.2下載歷史版本 登錄網站 選擇大版本 選擇詳細版本號 要點擊bin ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...