用戶畫像產品化——從零開始搭建實時用戶畫像(六)

来源:https://www.cnblogs.com/tree1123/archive/2020/06/29/13205991.html

在開發好用戶標簽以後,如何將標簽應用到實際其實是一個很重要的問題。只有做好產品的設計才能讓標簽發揮真正的價值,本文將介紹用戶畫像的產品化過程。 一、標簽展示 首先是標簽展示功能,這個主要供業務人員和研發人員使用,是為了更直觀的看見整個的用戶標簽體系。 不同的標簽體系會有不同的層級,那麼這個頁面的設計 ...


在開發好用戶標簽以後,如何將標簽應用到實際其實是一個很重要的問題。只有做好產品的設計才能讓標簽發揮真正的價值,本文將介紹用戶畫像的產品化過程。

一、標簽展示

首先是標簽展示功能,這個主要供業務人員和研發人員使用,是為了更直觀的看見整個的用戶標簽體系。

不同的標簽體系會有不同的層級,那麼這個頁面的設計就需要我們展示成樹狀的結構,方便以後的擴展。

在最後一個層級,比如自然性別,可以設計一個統計頁面,在進入頁面後,可以展示相應的數據統計情況,

可以更直觀看見標簽中值得比例,也可以為業務提供好的建議,另外可以對標簽的具體描述進行展示,起到一個說明的作用,還可以展示標簽按天的波動情況,觀察標簽的變化情況。

這一部分的數據來源呢?之前也提到過,這些標簽的元數據信息都存在mysql中,方便我們查詢。

所以樹狀圖和標簽描述信息需要去mysql中獲取,而比例等圖表數據則是從Hbase,Hive中查詢獲取的,當然也有直接通過ES獲取的。但是每天的標簽歷史波動情況,還是要通過每天跑完標簽後存在mysql中作為歷史記錄進行展示。

二 、標簽查詢

這一功能可以提供給研發人員和業務人員使用。

標簽查詢功能其實就是對用戶進行全局畫像的過程,對於一個用戶的全量標簽信息,我們是需要對其進行展示的。

輸入用戶id後,可以查看該用戶的屬性信息、行為信息、風控屬性等信息。從多方位瞭解一個具體的用戶特征。

這些已經是標簽的具體信息了,由於是對單一id的查找,從hive中獲取會造成查詢速度的問題,所以我們更建議從Hbase或者ES中查詢獲取,這樣查詢效率和實時性都能獲得極大的提升。

三、標簽管理

這一功能是提供給研發人員使用的。

對於標簽,不能每一次新增一個標簽都進行非常大改動,這樣是非常耗費人力的,所以必須要有可以對標簽進行管理的功能。

這裡定義了標簽的基本信息,開發方式,開發人員等等,在完成標簽的開發以後,直接在此頁面對標簽進行錄入,就可以完成標簽的上線工作,讓業務人員可以對標簽進行使用。

新增和編輯標簽的頁面,可以提供下拉框或者輸入框提供信息錄入的功能。

之前已經提到過,這些標簽的元數據信息都保存在了Mysql中,只要完成對其的新增和修改就可以了。

四、用戶分群

作為用戶畫像最核心的功能,用戶分群功能。是用戶畫像與業務系統建立聯繫的橋梁,也是用戶畫像的價值所在。

這項功能主要供業務人員使用。

此功能允許用戶自定義的圈定一部分人員,圈定的規則就是對於標簽的條件約束。

在圈定好人群以後,可以對這部分人群提供與業務系統的外呼系統,客服系統,廣告系統,Push系統的交互,達到真正的精細化運營的目的。

對於標簽規則的判斷,需要將記錄好的規則存儲於Mysql中,在進行人群計算時又需要將規則解析成可計算的邏輯。不管是解析成Sql或者其他的查詢語言都難度巨大,這對於研發是一個非常大的挑戰。

在此功能中,還可以增加人群對比的功能,對不同人群的不同標簽進行圈定,對比。這對於查詢性能也是一個巨大的考驗。

但是,用戶分群功能作為用戶畫像的核心是我們必須要實現的。對於技術架構,Hbase更擅長與KV形式的查詢,對於多維度查詢性能較差,所以可以採取ES索引,在ES查詢出Hbase的Rowkey,再去查詢Hbase的方式。也有很多公司選擇整體遷移到ES中完成此項工作。那麼ES可以勝任這項工作嗎?

下一章,我們來聊一聊如何用ES來實現用戶分群,未完待續~

參考文獻

《用戶畫像:方法論與工程化解決方案》

更多實時數據分析相關博文與科技資訊,歡迎關註 “實時流式計算” 獲取用戶畫像相關資料 請關註 “實時流式計算” 回覆 “用戶畫像”


您的分享是我們最大的動力!

更多相關文章
  • 最近開發項目的時候發現公司伺服器用root賬號登錄的時候 一直會提示有新的信件,一直提示一直提示。 聯想到另一臺伺服器上 的dead.letter文件每天都不斷的變大 而且在 root家目錄里 ,系統硬碟里。過十天半個月就會收到 伺服器的磁碟使用率超90%的報警簡訊, 我突然感覺是時候去除了一下這個 ...
  • 1.文件操作 touch命令 創建文件,如果文件名稱不存在,那麼直接創建;如果存在,那麼更改訪問時間 touch [option] filename1 filename2... [email protected]:~/Test# touch hello.c [email protected]:~/Test# ls hell ...
  • 一,查看磁碟空間大小的命令:df df命令用於查看磁碟分區上的磁碟空間,包括使用了多少,還剩多少,預設單位是KB 命令: df -hl 結果如下: 結果每列的含義: 第一列Filesystem,磁碟分區 第二列Size,磁碟分區的大小 第三列Used,已使用的空間 第四列Avail,可用的空間 第五 ...
  • 一 Longhorn存儲部署1.1 Longhorn概述Longhorn是用於Kubernetes的開源分散式塊存儲系統。提示:更多介紹參考:https://github.com/longhorn/longhorn。1.2 Longhorn部署 1 [[email protected] ~]# cd /op ...
  • [email protected]:~/linux$ fish 代表用戶名 ubuntu 代表機器名 ~ 代表家目錄 ~/linux 當前所在目錄 $ 代表普通用戶 [email protected]:/home/python# 管理員對應是#符號 2.回到家目錄的方式 cd cd ~ $HOME 環境變數代表的是家目 ...
  • MySQL Error (Always Continue) 其實大部分error在網上都有對應的解決辦法,尤其是對Mysql這種使用範圍很廣的技術。自己就不為每個error單獨發佈博客了,僅在這裡不斷添加,將自己遇到過的error,error原因,以及解決過程整理於此。 Error 1366 Err ...
  • use master go 使用預設資料庫 if exists(select * from sys.databases where name='A') drop database A go 檢查是否存在資料庫A,如果存在則刪除 create database A go use A go 創建資料庫A ...
  • 基於web的機票管理系統 1 摘 要 近年來,我國發展迅速,對交通工具的需求量大幅度增加。飛機作為出行工具之一,花費時間短、用戶體驗度好,價格實惠、安全性高等優點自然成為人們的首選,這也導致等待時間長、購票效率低等一系列問題的出現,給用戶和航空公司造成嚴重困擾。面對這些問題,線上機票預訂系統顯得格外 ...
一周排行
  • 圖文講解,一門教學級邏輯式編程語言,NMiniKanren,的運行原理。 ...
  • 多Sheet導入教程 說明 本教程主要說明如何使用Magicodes.IE.Excel完成多個Sheet數據的Excel導入。 要點 多個相同格式的Sheet數據導入 多個不同格式的Sheet數據導入 主要步驟 1. 多個相同格式的Sheet數據導入 1.1 創建導入Sheet的Dto 主要代碼如下 ...
  • 在KeyPress事件中寫入 private void txtBoxKeyPress(object sender, KeyPressEventArgs e) { if ((e.KeyChar >= 'a' && e.KeyChar <= 'z') || (e.KeyChar >= 'A' && e. ...
  • 在 Xunit 中使用依賴註入 Intro 之前寫過一篇 xunit 的依賴註入相關的文章,但是實際使用起來不是那麼方便 今天介紹一個基於xunit和微軟依賴註入框架的“真正”的依賴註入使用方式 ——— Xunit.DependencyInjection, 來自大師的作品,讓你在測試代碼里使用依賴註 ...
  • 官網 http://www.hzhcontrols.com/ 前提 入行已經7,8年了,一直想做一套漂亮點的自定義控制項,於是就有了本系列文章。 GitHub:https://github.com/kwwwvagaa/NetWinformControl 碼雲:https://gitee.com/kww ...
  • 在項目的實際開發過程中,我們經常會遇到Tab頁面的開發 EciTab控制項有多種使用方式: 下麵介紹Frame容器方式: 下麵介紹的Tab頁面採用的策略是 Tab頁面管理幾個子頁面,頁面組織上用Iframe管理的模式 採用Iframe的原因主要有兩個 1.開發簡單,每一個頁面都是簡單的畫面 2.性能考 ...
  • 引用的DLL MySql.Data.MySqlClient System.Data City實體 public class City { public int ID { get; set; } public string Name { get; set; } public string Countr ...
  • 案例故事: 即時通訊(IM)軟體有很多,比如企業微信,釘釘,飛書,Skype, 微軟的Lync等, 這些軟體現在都很牛,還能監控誰誰在不在電腦旁工作,誰誰誰提前下班溜了。。。 一次偶然的機會,有個妹子請教我,她每天都想準時18點下班, 她問我如何做到: 假裝企業微信線上,併在2個小時後(20點)準時 ...
  • 一.官方文檔 https://pypi.org/project/muggle-ocr/ 二模塊安裝 pip install muggle-ocr # 因模塊過新,阿裡/清華等第三方源可能尚未更新鏡像,因此手動指定使用境外源,為了提高依賴的安裝速度,可預先自行安裝依賴:tensorflow/numpy ...
  • 前言 ​ 關於 Python 這個欄目,咕了幾個月了,今天講講如何發送驗證碼並驗證。 ​ 因為部分原因,寫這篇文章的時候心情是不太好的,播放首歌吧。 代碼 導入 導入yagmail,random和time庫 import yagmail,random,time #導入 yagmail , rando ...