數據分析師如何自力更生統計用戶行為頻次?

来源:https://www.cnblogs.com/jjliu/archive/2019/10/24/11730241.html
-Advertisement-
Play Games

不懂數據分析的 growth hacker 不是好運營。近日我想要統計我家產品 [xue.cn](https://xue.cn/) 用戶的編程自學行為的頻次,且在不給技術開發部門帶來任何新需求的情況下自力更生。那麼,我該如何定義並統計這個數據指標呢? ...


不懂數據分析的 growth hacker 不是好運營。近日我想要統計我家產品 xue.cn 用戶的編程自學行為的頻次,且在不給技術開發部門帶來任何新需求的情況下自力更生。那麼,我該如何定義並統計這個數據指標呢?

1、定義學習這個行為。

某些行為是單個事件,某些行為是多種事件的組合。

xue.cn 用戶的編程自學行為包括:完成某書一個章節的閱讀、完成一道習題、獲得一個成就、提交一次評論,完成一次心得打卡等,未來還會有更多。不過,雖然我們有聊天室,但因為使用的是 gitter ,所以數據採集並不容易,這個行為就暫忽略。

以上編程自學行為事件數據分佈在產品資料庫的多個表中。

2、日誌數據的初步篩選。

通過在多個表中聯合查詢 user_id,事件發生日期得到每個 user_id 有學習行為的日期數據,我的 sql 語句是這麼寫的:

with data_study as( -- 獲取有學習行為的用戶名單及學習事件發生時間
    select 
        date(created_at) as time,
        user_id
    from user_comment
    union all
    select 
        date(created_at) as time,
        user_id
    from user_activity
    union all
    select 
        date(created_at) as time,
        user_id
    from study_card
)
select -- 獲取學慣用戶的學習日期數據
    user_id,
    min(time) -- 某天有多次學習行為,僅取一條即可
from data_study
group by user_id,time
order by user_id

3、統計的基準線

游客體驗功能是近期剛上線的。已有的學習行為數據,屬於較早版本,那時用戶產生學習行為的前提是至少完成一次時長兌換或小額RMB充值,所以本次我以用戶首次付費的日期作為統計的基準線。

從日誌數據篩選獲取用戶的首次付費日期數據,我的 sql 語句是這麼寫的:


with data as( -- 獲取用戶付費日期
    select 
        user_id,
        used_at as 付費日期
    from 
        free_coupons 
    where 
        user_id is not null 
    union all
    select 
        user_id,
        created_at as 付費日期
    from 
        rmb_order
    where order_status = 'PAY_SUCCESS'
)
select  -- 篩選付費用戶的首次付費日期
    user_id,
    date(min(付費日期)) as reg_date
from
    data
group by 
    user_id

4、統計與分析

至此,有用的數據已從日誌中初步篩選統計得到。接下來,用學習日期 - 首次付費日期得到血虛行為發生於首次付費後的第N天。其後統計:

  • A:首次付費後的第N天仍有學習行為的用戶數。
  • B:首次付費後的第N周(取值0至8),學習天數達到M天(取值1至7)的的用戶數。

A可作為付費版留存率數據。B則是學習頻次分佈數據。

因為我對複雜的 sql 運算還不熟練,所以實操時把第 2 和 3 步的結果從 grafana導出為 csv 文件,然後採用excel,部分指標則採用 python pandas完成演算。

5、精細選擇用戶群體

雖然當前 xue.cn 功能已經完善很多,其實我們是上半年剛立項,這半年多持續開發,某些學習功能在早期並未提供。於是,為了獲取更可信、有效的數據,需要剔除早期批次的用戶。

具體來說,根據用戶首次付費日期,按月拆分用戶批次,再拆分統計學習行為數據較為完善的近期批次數據。

6、小結

以上就是我完成 xue.cn 用戶學習頻次指標的指定與統計分析的實操過程。這次數據洞察探索,幫我發現好幾處增長線索。

筆記的第4、5步對於運營、市場人員都是常用操作,我就不詳細貼步驟或演算方式啦。而前面的第2、3步,我是通過 grafana 直接用查詢語句與我們家產品的資料庫交互。之前我寫過一篇 grafana 的上手筆記,它還是相當簡易的。——具體到我的本次需求來說,是否採用 grafana 不關鍵,grafana 只是一種工具,關鍵是要能與產品資料庫交互拿到原始數據。

筆記雖然解決的是編程自學行為,是我家產品為用戶所提供價值的核心表現,但思路也可借鑒用於其它產品、其它行為頻次的統計。如果對你有幫助或啟發,那就點贊或留言告訴我,鼓勵我分享更多筆記吧!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在這篇筆記中,我不僅記錄了自己如何完成按某個欄位的取值範圍進行統計的需求,既有早期的硬編碼風格,也有升級版的語句。我還分享了自己如何看待初學編程時的笨拙代碼,如何應對一個難題接著一個難題的編程自學過程。希望我的筆記,帶給你啟發和力量。 ...
  • 1.資料庫:是一個長期存儲在電腦內的、有組織的、有共用的、統一管理的數據集合。它是一個按數據結構來存儲的和管理數據的電腦軟體系統,即資料庫包含兩層含義:保管數據的“倉庫”,以及數據管理的方法和技術。 2.資料庫的特點:實現數據共用,減少數據冗餘;採用特定的數據類型;具有較高的數據獨立性;具有統一 ...
  • 一、安裝MyCat 1.安裝準備環境 1.1 安裝JDK 因為MyCat是java開發的,所以需要java虛擬機環境,在Linux節點中安裝JDK是必須的。 1.2 放開相關埠 在主從節點上都放開對埠3306的訪問,或者直接關閉防火牆。 臨時關閉 service iptables stop se ...
  • 今天從另一個系統往mysql資料庫寫入數據,發現中文變成了????? 檢查資料庫的設置 ,server對應字元集是latinl 調整mysql參數配置,配置文件目錄/etc/mysql/mysql.conf.d/ 添加一行:character-set-server = utf8 然後重啟mysql服 ...
  • 網上些解決方法,就是關閉審計,之前也有同事推薦這樣,下麵就是關閉審計的步驟。 VALUE=DB即審計開啟,改成FALSE即可。 有時還需要將另一個參數修改 ...
  • 在觸發器的“觸發”過程中,有兩個臨時表inserted和deleted發生了作用。這兩個特殊的臨時表inserted和deleted,僅僅在觸發器運行時存在,它們在某一特定時間和某一特定表相關。 CREATE TABLE [dbo].[A] ( [id] INT IDENTITY (1, 1) NO ...
  • 1、首先切換到Oracle用戶 [oracle@oracletest ~]$ cd /u01/app/oracle/product/11.2.0/db_1/bin/ 標紅字體部分資料庫可能不一樣,有的是dbhome_1,以自己實際配置目錄為準 [oracle@oracletest bin]$ vi ...
  • 語法 摘錄 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...