QPython實例01-獲取所有簡訊並生成詞雲

来源:https://www.cnblogs.com/bushrose/archive/2023/01/29/17073949.html
-Advertisement-
Play Games

一、QPython安裝配置 1.1. QPython介紹 QPython是一個可以在安卓設備運行python的腳本引擎。版本有QPython 3L和QPython 3C,3L為官方版本,可以在應用市場搜索下載。3C版本為"乘著船"大佬的修改版本。由於3L版本有許多許可權限制及很多包不能安裝,文章中使用 ...


一、QPython安裝配置

1.1. QPython介紹

QPython是一個可以在安卓設備運行python的腳本引擎。版本有QPython 3L和QPython 3C,3L為官方版本,可以在應用市場搜索下載。3C版本為"乘著船"大佬的修改版本。由於3L版本有許多許可權限制及很多包不能安裝,文章中使用3C版本完成。

1.2. 下載地址

百度搜索"QPython 3C開源版",進入gitee,找到鏈接即可下載,如下圖:
Screenshot_2023-01-29-14-53-48-450_mark

百度網盤下載:https://pan.baidu.com/s/1zT1NGtYTe55m6bSRWlePRg
提取碼:zxcv

幫助文檔:https://www.bilibili.com/read/cv13322251

二、獲取簡訊內容並生成詞雲

  • 獲取簡訊內容
    獲取簡訊將使用SL4A 的api,關於SL4A的介紹及文檔,打開第一點gitee中相關鏈接,如下圖:
    Screenshot_2023-01-29-19-35-29-899_mark
    話不多說,直接上代碼:

  • 獲取所有簡訊並存入csv

import androidhelper
import csv

droid=androidhelper.Android()
# 獲取簡訊具體內容並存入csv
def saveSMSToFile(save_path):
    # 獲取所有收取的簡訊。False為獲取所有簡訊,True為獲取未讀簡訊;inbox為收件箱,outbox為發件箱
    sms_data=droid.smsGetMessages(False, 'inbox').result
    '''
    id:每條簡訊的原始id
    address:對方手機號
    date:簡訊息的時間戳
    body:簡訊具體內容
    read:已讀未讀,1為已讀,0是未讀。
    status不知道是啥
    type,發信息還是收信息,1為收,2為發
    '''
    headers=['_id', 'address', 'date', 'body', 'read', 'status', 'type']
    
    with open(save_path,'w') as f:

        f_scv = csv.DictWriter(f, headers)

        f_scv.writeheader()

        f_scv.writerows(sms_data)

    return save_path
  • 利用jieba分詞及pyecharts生成詞雲

# 停用詞,生成詞雲會過濾,根據實際情況修改
FILTER_WORDS = ['你', '我','他','我們', '他們', ',','驗證碼',':', '的','賬號', 'cn', 'https', '0.00', '點擊', '退訂', '尊敬','客戶', 'TD', '登錄','http', '12582', '61.56', '0.42','u.10010', 'http', 'com']


#獲取關鍵詞數量,用於詞雲展示時的數量,num可以修改,詞雲展示生成時的數量 
def getKeyWordsCounts(filepath, num=30):  
    with open(filepath,'r') as f:  
        f_csv=csv.reader(f)  
        headers=next(f_csv)  
        content=",".join([row[3] for row in f_csv])  
        #print(content)  
        seg_list=list(jieba.cut(content))  
        # print(seg_list)  
         
    keywords_counts = pd.Series(seg_list)  
    keywords_counts = keywords_counts[keywords_counts.str.len()>1]  
    keywords_counts = keywords_counts[~keywords_counts.str.contains('|'.join(FILTER_WORDS))]  
    keywords_counts = keywords_counts.value_counts()[:num]  
    return keywords_counts


# 構建生成詞雲的元組  
def getWords(keywords_counts):  
    words=[]  
    for i, v in keywords_counts.items():  
        words.append((i,v))  
    return words


# 渲染html  
def render_html(html_filepath,words):  
    c = (  
        WordCloud()  
        .add(  
            "",  
            words,  
            word_size_range=[20, 100],  
            textstyle_opts=opts.TextStyleOpts(font_family="cursive"),  
        )  
        .set_global_opts(title_opts=opts.TitleOpts(title=os.path.splitext(html_filepath)[0]))  
        .render(html_filepath)  
)


# 生成詞雲  
def genWordCloud(csv_filepath,html_filepath, num=30): csv_filepath=saveSMSToFile(csv_filepath)  
    keywords_counts=getKeyWordsCounts(csv_filepath, num=30)  
    words=getWords(keywords_counts)  
    render_html(html_filepath, words)

  • 傳入文件地址及html地址
csv_filepath='/storage/emulated/0/0/sms.csv'  
html_filepath='/storage/emulated/0/0/簡訊詞雲分析.html'  
genWordCloud(csv_filepath, html_filepath)  
  
# 使用qpython自帶的瀏覽器訪問  
jsla('viewHtml', html_filepath)

最終實現效果如下圖:
Screenshot_2023-01-29-20-53-24-898_indi

完整版代碼,點擊底部閱讀原文,回覆【Qpython詞雲】

三、總結

文章採用Sl4A和QPython完成了簡訊詞雲生成。SL4A提供了豐富的api,如通過QPython結合scikit-learn監測並過濾刪除垃圾簡訊等,這些都由大家自己去探索。

閱讀原文

本文由公眾號【產品經理不是經理】同步發佈,歡迎關註


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • props props簡單使用 class Person extends React.Component { render() { return ( <ul> <li>姓名:{this.props.name}</li> <li>年齡:{this.props.age}</li> <li>性別:{thi ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 需求描述 目前大多數PC端應用都有配套的移動端APP,如微信,淘寶等,通過使用手機APP上的掃一掃功能去掃頁面二維碼圖片進行登錄,使得用戶登錄操作更方便,安全,快捷。 思路解析 PC 掃碼原理? 掃碼登錄功能涉及到網頁端、伺服器和手機端, ...
  • 一、文件上傳 1、普通文件上傳 JavaScript 可以使用表單提交來實現文件上傳。首先,在 HTML 中創建一個文件輸入框: <input type="file" id="fileInput"> 然後,在 JavaScript 中獲取文件輸入框的引用,併在其上設置事件監聽器,如下所示: var ...
  • 最近在開發幾個網站,為了優化一下前端代碼,就複習一下gulpjs,之前工作gulp用的版本比較老,但是今天看了新的版本,新的語法出了一下,但是為了時間,我決定使用之前gulp3的舊版本,後面發現自己環境的node的版本是最新的,所以不得讓我來瞭解一下gulp的新版本,裡面用到的最多就是commonj ...
  • 一、條件判斷 JavaScript 中有三種方法可以用來進行條件判斷: 1、使用 if-else 語句。這種方法用於在特定條件為 true 時執行一段代碼,否則執行另一段代碼。例如: let a = 5; if (a > 10) { console.log("a is greater than 10 ...
  • Angularjs的工程化 AMD規範和CMD規範 為什麼需要模塊化管理工具 在編寫項目時可能需要載入很多js文件,若b.js依賴a.js,且a.js比b.js大很多,那麼瀏覽器會讓b.js等待a.js載入完畢後再去執行b.js里的內容;而即使d.js並不依賴a.js,b.js,c.js,也會等待這 ...
  • 前端面試題學習-HTML-個人總結 這是看別人總結的基礎上再度總結的,總結的鏈接如下 鏈接 1. DOCTYPE 的作用? 告知瀏覽器解析器用何標準解析文檔,若不指定則按相容模式進行解析(向後相容模擬老瀏覽器)。 IE5.5 引入的概念。 HTML5 之後無需指定,因為在之前的都是基於 SGML 的 ...
  • 實現Spring底層機制-03 7.實現任務階段5 7.1分析 階段5目標:bean後置處理器的實現 7.2代碼實現 新增: 1.創建 InitializingBean 介面,實現該介面的 Bean 需要實現 Bean 的初始化方法 bean後置處理器的兩個方法,調用時機分別在 Bean 初始化方法 ...
一周排行
    -Advertisement-
    Play Games
  • 周末,寫點簡單的水一下。 新版本的vs創建項目的時候可以選擇自帶一個swagger。然而這隻是基本的swagger功能。 幾個介面無所謂啦,隨著介面越來越多,就這麼丟給你,一時間也會懵逼,所以這篇文章要做的有兩個功能。 給swagger文檔添加註釋 給swagger添加切換“版本”的功能(也可以理解 ...
  • 大家好,我是沙漠盡頭的狼。 本文首發於Dotnet9,介紹使用Lib.Harmony庫攔截第三方.NET庫方法,達到不修改其源碼並能實現修改方法邏輯、預期行為的效果,並且不限於只攔截public訪問修飾的類及方法,行文目錄: 什麼是方法攔截? 示常式序攔截 非public方法怎麼攔截? 總結 1. ...
  • 問題代碼: xmal:一個按鈕+一個顯示框 1 <Button Width="100" Height="50" Margin="10" Click="Button_Click">test</Button> 2 <TextBox x:Name="display" Width="300" Height= ...
  • 前置條件 ​ 阿裡雲伺服器一臺(可在購買伺服器時勾選安裝寶塔選項,免去後面的寶塔安裝) ​ 設置阿裡雲伺服器密碼並登陸伺服器 ​ 以下操作均在伺服器Linux中進行(使用遠程連接工具登錄) 寶塔登錄 登錄阿裡雲伺服器在Linux命令行中輸入bt,查看寶塔信息 ​ 根據寶塔信息提供的網站登陸寶塔服務( ...
  • GetTokenInformation 用於檢索進程或線程的令牌(Token)信息。Token是一個數據結構,其包含有關進程或線程的安全上下文,代表當前用戶或服務的安全標識符和許可權信息。GetTokenInformation函數也可以用來獲取這些安全信息,通常用於在運行時檢查某個進程或線程的許可權或安... ...
  • matplotlib 在1.0版本之前其實是不支持3D圖形繪製的。 後來的版本中,matplotlib加入了3D圖形的支持,不僅僅是為了使數據的展示更加生動和有趣。更重要的是,由於多了一個維度,擴展了其展示數據分佈和關係的能力,可以一次從三個維度來比較數據。 下麵介紹在matplotlib中繪製各類 ...
  • 編寫一個App就能編譯發佈到iOS、Android和Web等各大平臺的跨平臺技術,各大廠商一直都有研究和發佈對應技術產品,目前最熱門的莫過於Flutter框架了。而Dart作為其唯一的編程語言,今天我們開始來體驗一下…… ...
  • 實現基本的線程池 前提:我們要實現的線程池有如下功能: 基本的線程池模型 能提交和運行任務 能正常關閉線程池 線程的拒絕策略 線程池擴容 縮容線程池 代碼地址: 1、線程池的介紹? 線程池是什麼? 線程池是一種利用池化技術來管理線程的一種技術。 當沒有線程池的時候,我們如何創建線程? 繼承Threa ...
  • SDRAM基本信息 儲存能力計算 4X16X4=256(Mbit),註意不是MByte SDRAM控制 sdram包含兩個部分:sdram_ctrl、fifo_ctrl。 sdram_ctrl:其頂層為SDRAM的控制模塊內部實例化了5個模塊,有初始化、自刷新、寫和讀模塊,還有一個仲裁模塊對這四個不 ...
  • 歡迎訪問我的GitHub 這裡分類和彙總了欣宸的全部原創(含配套源碼):https://github.com/zq2599/blog_demos 本篇概覽 欣宸正在為接下新的Java雲原生實戰系列原創做準備,既然是實戰,少不了一套雲原生環境,以下內容是必不可少的: linux操作系統 kuberne ...