在開發好用戶標簽以後,如何將標簽應用到實際其實是一個很重要的問題。只有做好產品的設計才能讓標簽發揮真正的價值,本文將介紹用戶畫像的產品化過程。 一、標簽展示 首先是標簽展示功能,這個主要供業務人員和研發人員使用,是為了更直觀的看見整個的用戶標簽體系。 不同的標簽體系會有不同的層級,那麼這個頁面的設計 ...
在開發好用戶標簽以後,如何將標簽應用到實際其實是一個很重要的問題。只有做好產品的設計才能讓標簽發揮真正的價值,本文將介紹用戶畫像的產品化過程。
一、標簽展示
首先是標簽展示功能,這個主要供業務人員和研發人員使用,是為了更直觀的看見整個的用戶標簽體系。
不同的標簽體系會有不同的層級,那麼這個頁面的設計就需要我們展示成樹狀的結構,方便以後的擴展。
在最後一個層級,比如自然性別,可以設計一個統計頁面,在進入頁面後,可以展示相應的數據統計情況,
可以更直觀看見標簽中值得比例,也可以為業務提供好的建議,另外可以對標簽的具體描述進行展示,起到一個說明的作用,還可以展示標簽按天的波動情況,觀察標簽的變化情況。
這一部分的數據來源呢?之前也提到過,這些標簽的元數據信息都存在mysql中,方便我們查詢。
所以樹狀圖和標簽描述信息需要去mysql中獲取,而比例等圖表數據則是從Hbase,Hive中查詢獲取的,當然也有直接通過ES獲取的。但是每天的標簽歷史波動情況,還是要通過每天跑完標簽後存在mysql中作為歷史記錄進行展示。
二 、標簽查詢
這一功能可以提供給研發人員和業務人員使用。
標簽查詢功能其實就是對用戶進行全局畫像的過程,對於一個用戶的全量標簽信息,我們是需要對其進行展示的。
輸入用戶id後,可以查看該用戶的屬性信息、行為信息、風控屬性等信息。從多方位瞭解一個具體的用戶特征。
這些已經是標簽的具體信息了,由於是對單一id的查找,從hive中獲取會造成查詢速度的問題,所以我們更建議從Hbase或者ES中查詢獲取,這樣查詢效率和實時性都能獲得極大的提升。
三、標簽管理
這一功能是提供給研發人員使用的。
對於標簽,不能每一次新增一個標簽都進行非常大改動,這樣是非常耗費人力的,所以必須要有可以對標簽進行管理的功能。
這裡定義了標簽的基本信息,開發方式,開發人員等等,在完成標簽的開發以後,直接在此頁面對標簽進行錄入,就可以完成標簽的上線工作,讓業務人員可以對標簽進行使用。
新增和編輯標簽的頁面,可以提供下拉框或者輸入框提供信息錄入的功能。
之前已經提到過,這些標簽的元數據信息都保存在了Mysql中,只要完成對其的新增和修改就可以了。
四、用戶分群
作為用戶畫像最核心的功能,用戶分群功能。是用戶畫像與業務系統建立聯繫的橋梁,也是用戶畫像的價值所在。
這項功能主要供業務人員使用。
此功能允許用戶自定義的圈定一部分人員,圈定的規則就是對於標簽的條件約束。
在圈定好人群以後,可以對這部分人群提供與業務系統的外呼系統,客服系統,廣告系統,Push系統的交互,達到真正的精細化運營的目的。
對於標簽規則的判斷,需要將記錄好的規則存儲於Mysql中,在進行人群計算時又需要將規則解析成可計算的邏輯。不管是解析成Sql或者其他的查詢語言都難度巨大,這對於研發是一個非常大的挑戰。
在此功能中,還可以增加人群對比的功能,對不同人群的不同標簽進行圈定,對比。這對於查詢性能也是一個巨大的考驗。
但是,用戶分群功能作為用戶畫像的核心是我們必須要實現的。對於技術架構,Hbase更擅長與KV形式的查詢,對於多維度查詢性能較差,所以可以採取ES索引,在ES查詢出Hbase的Rowkey,再去查詢Hbase的方式。也有很多公司選擇整體遷移到ES中完成此項工作。那麼ES可以勝任這項工作嗎?
下一章,我們來聊一聊如何用ES來實現用戶分群,未完待續~
參考文獻
《用戶畫像:方法論與工程化解決方案》
更多實時數據分析相關博文與科技資訊,歡迎關註 “實時流式計算” 獲取用戶畫像相關資料 請關註 “實時流式計算” 回覆 “用戶畫像”