手機通話記錄統計分析

来源:http://www.cnblogs.com/shangfr/archive/2016/06/14/5564949.html
-Advertisement-
Play Games

現如今,智能手機是人手一份。每天我們都通過手機與外界溝通交流,手機作為必不可少的媒介,無形中記錄著我們日常生活中的點點滴滴。這些信息主要包括個人位置信息、通信信息、賬號密碼信息、存儲文件信息等四大類。由於Android是開源的,軟體用戶可自行對軟體進行修改、複製及再分發,直接進行信息交換。有些用戶還... ...


現如今,智能手機是人手一份。每天我們都通過手機與外界溝通交流,手機作為必不可少的媒介,無形中記錄著我們日常生活中的點點滴滴。這些信息主要包括個人位置信息、通信信息、賬號密碼信息、存儲文件信息等四大類。由於Android是開源的,軟體用戶可自行對軟體進行修改、複製及再分發,直接進行信息交換。有些用戶還會自己對系統進行破解,獲取許可權,竊取個人信息。一些山寨手機甚至還留有後門程式,固化竊聽軟體,並通過遠程遙控使手機話筒在用戶不知情的情況下開啟,把手機變成一個竊聽-器,造成個人隱私泄露。

因此,通過對手機數據的挖掘與分析,可以便捷地進行用戶行為分析;比如,利用手機定位數據可以進行用戶特征挖掘;利用通話記錄可以進行社交親密度分析等等。我帶著這個想法,導出自己手機上可以找到的各種數據文件,並通過R軟體十對這些數據進行了簡單的統計分析,現將步驟記錄如下:

通話記錄分析

首先,讀取xml格式通話記錄並解析,將其轉換成數據框格式;然後便可以通過DT包快速便捷地查看通話記錄。

library(XML)

xmlfile=xmlParse(file.choose(),encoding="UTF-8") #讀取xml格式通話記錄並解析
mydata=xmlToDataFrame(xmlfile) #轉換格式

head(mydata)
mydata$Duration=as.numeric(mydata$Duration) 

查看列表

library(DT)
datatable(mydata, options = list(pageLength = 10))

按人統計通話記錄

calldata=data.frame(Totaltime=with (mydata , tapply (Duration , list (ContactName) , sum ) ),
                    Average=with (mydata ,tapply (Duration , list (ContactName) , mean ) ))
head(calldata)

library(plotly)
plot_ly(calldata,x=rownames(Totaltime),y=Totaltime,type = "bar",name = "sum")
add_trace(calldata,x=rownames(Average),y=Average,name = "mean")

查詢

plot_ly(mydata[mydata$ContactName=="張三",],x=StartTime,y=Duration,type = "bar")
plot_ly(mydata[mydata$ContactName=="張三",],x=StartTime,y=Duration)

按日統計通話記錄

library(dygraphs)
library(xts)

mydata$StartTime=as.Date(mydata$StartTime) #去除分秒
daydata=with (mydata, tapply (Duration , list (StartTime) , sum ) ) #每日通話時長

dygraph(daydata, main = "每日通話時長走勢") %>% 
  dyRangeSelector(dateWindow = c("2016-05-01", "2016-06-01"))

### 轉化成時間序列畫圖
xtsdata=xts(daydata,as.Date(names(daydata)))
index(xtsdata)
dygraph(xtsdata, main = "每日通話時長走勢") %>% 
  dyRangeSelector(dateWindow = c("2016-05-01", "2016-06-01"))

這篇文章只記錄了對通話記錄的簡單統計和可視化,手機數據真正的寶礦是其內置的各種感測器,隨著物聯網時代的到來,如何通過優秀的演算法挖掘分析這些信號數據,具有十分重要的意義。

反饋與建議


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、標識符和關鍵字 關鍵字: 就是被java語言賦予了特殊含義的單詞。 特點就是所有的關鍵字都是小寫。 標識符: 就是給包、類、介面、方法、變數名起的名字。 規則:1.以數字、字母、_以及$符號組成。 2,不能以數字開頭,不能以空格分開,不能是JAVA中的關鍵字,區別大小寫如Test 和test是2 ...
  • list是一種有序的集合,可以隨時添加和刪除其中的元素。 >>> classmates = ['Michael', 'Bob', 'Tracy'] >>> classmates ['Michael', 'Bob', 'Tracy'] 獲取 >>> classmates[2] 'Tracy' 當索引超 ...
  • 我之前想寫路由器的密碼暴力破解器,我手上只有極路由,發現極路由有安全限制,只能允許連續10次密碼錯誤,所以我改拿博客園練手。 博客園的博客有個功能是給博文設置一個密碼,輸入正確的密碼才能看到文章的內容。經過測試發現這個密碼驗證功能,既沒有驗證碼也沒有提交頻率的限制, 要寫這個針對博客園的密碼暴力破解 ...
  • 本文適用於所有鍵盤類職業,比如程式員,比如作家,比如編輯,比如水軍,等等... 程式員買得起鍵盤嗎?買得起。 程式員買得起好的機械鍵盤嗎?也買得起。 不過大部分of他們是不會很快決定買的,包括我。因為打從一開始接觸電腦,不管是家裡還是學校甚至網吧,我們用的鍵盤也就是隨便玩玩的,並不會多在意,而等到自 ...
  • 1. download cas 4.2.2 from https://github.com/apereo/cas/releases 2. eclipse import cas 4.2.2 eclipse install SpringSource Update Site for Gradle Inte ...
  • 前段時間因為寫一個業務,對mysql的插入量非常大,在idea開發環境,使得idea一直爆出outofmemry提示,並導致old 區一直漲。使用Mongodb 作為存儲後,不僅插入速度大大提升,idea會卡死的頑疾也解決了。 Mongodb 能夠非常簡單的整合進項目 下麵是我的整合過程 ...
  • 單例模式 概念相關 單例模式 在程式運行過程,一個類只有一個實例 使用場合 在整個應用程式中,共用一份資源(這份資源只需要創建初始化1次) static static關鍵字會在聲明變數的時候分配記憶體,在程式運行期間只分配一次記憶體。之後再訪問時,實際都是在訪問原先分配的記憶體 如果使用static來修飾 ...
  • 對話框不能單獨存在,依賴於窗體,有顯示標題,有模式 獲取Dialog對象,new出來,構造參數:Frame對象,String的標題,模式 窗體內部的內容,Label對象,Button對象,調用Dialog對象的add()方法,把這兩個添加進去 Dialog也是一個普通的窗體,需要設置尺寸和位置 這個 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...