從洞察到決策,一文解讀標簽畫像體系建設方法論丨DTVision分析洞察篇

来源:https://www.cnblogs.com/DTinsight/archive/2022/08/08/16561721.html
-Advertisement-
Play Games

一、數字營銷是數字化轉型排頭兵 《⼗四五數字經濟發展規劃》中強調,要⼤⼒推進數字化轉型,形成數據驅動的智能決策能⼒,提升企業整體運營效率。 要做好數字化轉型,企業可從產、研、供、銷、⽤等多個環節入手,而 “銷” 恰好是第一關鍵要素,企業轉型往往從營銷場景入手,因此我們說數字化營銷是企業數字化轉型的排 ...


一、數字營銷是數字化轉型排頭兵

《⼗四五數字經濟發展規劃》中強調,要⼤⼒推進數字化轉型,形成數據驅動的智能決策能⼒,提升企業整體運營效率。

要做好數字化轉型,企業可從產、研、供、銷、⽤等多個環節入手,而 “銷” 恰好是第一關鍵要素,企業轉型往往從營銷場景入手,因此我們說數字化營銷是企業數字化轉型的排頭兵。

在數字化營銷轉型過程中,由於各個企業的數字化建設進程不同,往往會遇到多種挑戰,如:

· 企業數據如何打通?

· 客戶畫像如何建設?

· 營銷ROI如何提升?

· 營銷策略如何迭代?

file
要想解決以上問題,在業務⽣產與業務應⽤之前,讓產業數字化營銷,我們需要進⾏:

· 數據的統⼀存儲;

· OneID 的數據打通;

· OneModel 的數據模型建設;

· 數據資產的統⼀管理。

打好這些基礎,接下來就能開始建設企業自己的個性化標簽體系,讓標簽作為企業數字化營銷的基石,幫助消費者畫像更加精確。

實現用數據指導營銷,而不再只是含糊的經驗;讓活動的數據再迴流到數倉中,作為標簽數據來源的一部分,形成營銷業務閉環。

file

二、標簽體系建設方法論

那麼如何幫助企業構建完美的標簽體系呢?我們總結出“三目標 + 五步法”的方法論:

file

1、標簽體系建設三目標

● 目標一:解決業務問題

要確定我們建設標簽體系是為瞭解決什麼具體的業務問題,想要達到什麼效果,時間上要做到分期而治、小步快跑,早日推廣應用。

● 目標二:業務人員好用、易用

標簽體系的建設目標是要靈活可擴展,讓業務人員可以輕鬆衍生標簽、生產效率高。同時標簽應用方式還需要多種多樣,以適應不同的業務要求。

● 目標三:可持續更新迭代

標簽體系作為重要數據資產,需要我們對它進行持續完善,形成業務應用與數據開發部門良好互動,助力生產更有價值的數據。

2、標簽體系建設五步法

第一步 明確建設目標

在開始建設標簽時,我們需要明確建設目標,目標可以指導我們的執行策略無偏差,最終達到想要的結果,否則在建設過程中隨著一些信息的輸入、困難的出現,容易今天一榔頭明天一棒槌,顧此失彼,達不到業務期望的結果。

file
● 業務建設目標

業務建設目標,指通過標簽項目想解決什麼樣的問題,達到什麼樣的業務效果。比如

· 現在屬於粗略式的運營,需要基於標簽體系實現精細化運營,將營銷活動的轉化率提升5%;

· 標簽加工流程過於緩慢,從業務人員提需求到需求實現需要1-2周時間,需要將改時間縮短至1-3天;

· 現在數據來源過於單一,只有交易域,需要彙總其他域的數據,比如行為數據、評論數據、活動數據等豐富標簽體系維度。

一般列舉5-10條目標,業務部門與技術部門一起制定,基於這些目標,進行系統建設。

● 系統建設目標

為實現對應的業務目標,需要建設一個怎樣的系統,是內部實現,還是外部採購,各自的實現周期與成本,若外部採購,採購的標準是什麼等都需要考慮,該問題一般是技術部門來考慮。

· 系統給誰使用:是建設一個標簽加工與管理的標簽管理工具,主要給技術部門使用,因為企業已經有了營銷系統、涵蓋標簽圈群與推送給的功能。還是需要一個集合加工、管理、圈群、分析一體化的工具,數據分析師、業務人員也要用。不同的使用對象,系統建設的內容不一樣。

· 系統的技術架構要求:公司內部的大數據部門若已經用了一些底層平臺或技術組件,從節省成本方面,應當儘量用同一套底層存儲與計算平臺,比如已經採購了CDH、TDH的Hadoop,那標簽系統需要可直接對接這些系統進行數據存儲與計算。以及標簽系統需要和CRM系統、營銷平臺實現對接,便需要有相應的對接方案,如通過標簽服務API介面,或數據同步、推送等當時,將數據給到下游系統。

· 系統功能要求:基於標簽的加工、標簽的生名周期管理、標簽的數據安全、標簽的評估治理、標簽圈群、畫像洞察、對外服務等多方面梳理需要的功能。

· 系統性能要求:基於司內的數據量,標簽加工的速度、併發,標簽圈群與分析的查詢時間,所需要的部署資源、一年需要花費的成本需要進行評估與計算。

● 參與部門與執行計劃

根據我們一些標簽項目的建設經理,會出現這樣的情況,大數據部門一期項目建好的標簽,很難推動業務人員使用起來,主要有以下幾點原因:

業務人員覺得建設的標簽有用的很少,大多數都用不上;

用了一下標簽,覺得數據不准確,不敢用;

領導沒有說要用這些標簽,還是按照自己的既定模式來工作好了。

基於這些問題,標簽項目推進之初,需要拉上業務部門的領導、對接人一起參與,確定一個先應用標簽的項目或場景,做出效果,再應用到更多的部門及項目,否則剛開始大而全,周期長、且沒有目標性,往往後續推廣使用時會遇到阻礙。

● 參與部門包含以下:

· 需要標簽項目服務的業務部門(核心):如市場部、運營部、客服部、風控部等,各指定一名對接人員;

· 項目需求收集分析者:數據產品經理、數據分析師;

· 系統建設和標簽加工者:數據科技部門。

● 制定執行計劃:

· 項目是否需要分期,一期項目的目標和建設的標簽有哪些;

· 各期項目時間周期、負責人,上線場景;

· 上線後業務人員需要持續反饋使用情況,業務變化情況,不斷的優化迭代。

第二步 標簽體系建設

明確好建設目標之後的下一步就是標簽體系設計。

在此之前,我們先對一些標簽的重要概念做一些介紹:

file
標簽體系設計是一種對對象統一進行本質刻畫的數據描述辦法,把個體觀察升級為群體觀察,而非過去對個體現象的歸納,更具有面向未來的場景化適應能力。標簽體系設計的整體流程可分為 4 大步驟 + 2 大階段:

file
在此過程中我們需要:

● 規劃實體對象

確定標簽體系的對象,梳理標簽間的關係,設計標簽體系,做好標簽類目創建。

file
實體指我們要建立標簽體系的對象,如客戶標簽體系、商品標簽體系、渠道標簽體系、客戶經理標簽體系,客戶、商品、渠道、客戶經理都屬於我們的實體對象。其類似一顆樹的根,後續要基於“實體”,長出樹的枝幹、葉子、花等,所以劃分正確的實體很重要。

關係指多個實體之間的關係,如“客戶”購買“基金”,會使客戶實體與基金實體發生關係,形成新的標簽,比如加工“投資風險偏好”標簽,標簽值為“高風險”、“中高風險”、“低風險”等,需要利用客戶最近一年的交易記錄結合基金維表,當用戶購買基金的基金類型包含高風險,且最近一年購買金額>5000時,為高風險偏好。需要用到2個實體形成一個關係,來加工這個標簽。

● 探查數據

根據標準數據建倉規範,梳理下大概的客戶的數據域、業務過程、數據表、表的數據量、數據分佈等,掌握基於該數據,可以加工出哪些標簽。

file
● 設計標簽類目

基於已採集的業務需求、掌握的數據情況、規劃的實體的對象,建立實體對象的標簽類目體系。除根據客戶業務建設外,也會提供一些行業通用模板,作為參考。

標簽類目體系是“實體”樹的枝幹,為以後標簽生長的繁茂建立基礎,需要做到枝枝粗壯、分明,即每個類目需要有明顯的分割,且標簽的數量不能過多和過少,建議一個子類目不超過20個標簽,不少於3個標簽。

標簽類目層級根據業務實際情況劃分,一般2~3層即可(不包含標簽、標簽值)。如下圖:

file
● 設計標簽內容

包含標簽定義、加工方法判斷、加工範圍判斷等。

file
根據前面的需求調研、數據調研、類目劃分,梳理標簽體系中的標簽,需包含以下內容:

· 標簽中文、英文名:標簽的中文名稱、英文名稱;

· 標簽所屬類目:標簽所屬一級、二級、三級類目;

· 標簽類型:根據不同維度的劃分,採用其中一種。比如事實標簽、統計類標簽、預測類標簽,亦或是原子標簽、衍生標簽、組合標簽、自定義標簽等;

· 標簽值定義:定義每個標簽的標簽值,如“近一個月買入金額區間”標簽,可根據購買金額的區間段定義“零/低端”、“普通”、“中端”、“準高端”、“高端”等標簽值;

· 標簽含義(描述):描述該標簽業務含義,如“最近30天的購買商品的金額區間,對用戶消費力進行評估”;

· 業務口徑:標簽以哪個數據定義為準,如“用戶活躍城市”標簽,以用戶購買次數最多的城市為口徑加工,而不是瀏覽次數、評論次數等;

· 標簽技術口徑:描述該標簽從哪個表的哪個欄位取值,SQL取數邏輯是什麼;

· 業務方來源:該標簽的業務需求方是誰;

· 標簽更新周期:描述標簽更新頻次,天(如T+1、T+2等)、周、月、小時、分鐘更新等;

· 標簽更新優先順序:同一時間端跑多個標簽時,若資源有限,先跑優先順序高的標簽。

第三步 標簽加工與更新

標簽加工與更新包含各類型標簽加工、標簽測試和標簽上線與更新幾個步驟,在技術層面實現營銷需求。

file
● 判斷標簽加工方法

梳理標簽的加工方式,判斷哪些是離線標簽、實時標簽、演算法標簽,從而引入對應的產品和相應的開發人員來開發。業務場景中,離線標簽偏多,實時標簽次之,演算法標簽少之。

· 離線標簽:定時跑批,一般為天粒度,T+1跑批,晚上跑標簽結果,業務人員第二天做查詢。一些標簽若高頻率更新,也支持小時、分鐘粒度的更新。常需要Spark、Presto、Impala等跑批組件及產品。

· 實時標簽:實時加工,一般為秒或毫秒級加工,常見於用戶行為實時傳上來,基於用戶的實時行為,打標簽,進行商品推薦等。常需要採用Kafka消息隊列、Flink實時計算引擎組及產品。

· 演算法標簽:利用機器學習演算法、深度學習演算法,做一些預測類標簽,如根據用戶的購物商品和頻率,預測家裡是否有小孩、小孩年齡等。常需要Python開發環境和機器學習演算法包。

不同的加工類型,往往需要採用不同的計算引擎和框架,需判斷企業內容是否有這樣的能力加工,若無,外部採購的話需要供應商有什麼樣的能力,需要有大致的判斷。

● 劃分加工範圍

標簽的使用人員是業務人員,在以往老的流程中,需要業務人員向數據開發提需求加工新標簽,開發一個新標簽的周期一般1-2周之間。

為了使業務人員能夠靈活的加工規則標簽,儘快提取自己想要的數據,標簽的加工、管理目前多通過產品化的方式,使數據開發、數據分析師、業務人員都能參與標簽的開發。

這裡便涉及到哪些標簽由開發人員加工,哪些標簽由業務人員加工,標簽加工流程是什麼等。

file
可按照上述流程,在數據開發和業務人員之間有個標簽管理團隊,用來維護標簽的生命周期,包括標簽需求的分解、上下架等,可由數據分析師、業務人員組成。

● 大的劃分原則是:

基礎標簽的標簽由數據開發團隊加工,這類標簽是基於數倉數據加工的最細粒度標簽(是能打在用戶身上的標簽,不是某個單純的欄位),不能再被拆解。

基於基礎標簽可通過規則衍生的,由業務人員完成。

以上圖為例:當有一個“是否30天登錄未註冊用戶”標簽需求時,標簽管理團隊可判斷該標簽是否可基於基礎標簽衍生,若不行,則由數據開發加工對應的標簽。

若可以,則判斷是否有對應的基礎標簽可衍生,如舉例標簽,可拆解成“APP最近一次登錄日期”或”距最近一次登錄時間”,與“是否註冊”2個基礎標簽,便可基於基礎標簽,業務人員完成這2個標簽的加工與上線。

第四步 標簽生命周期管理

標簽生命周期管理是指包含標簽評估、標簽治理和標簽迭代等幾個對標簽的實際使用狀態負責的管理流程,幫助實現標簽建設與營銷的有機結合,不浪費任何一個動作指標。

file
● 從以下維度來評估標簽的重要性

標簽使用度評分:根據標簽引用次數、標簽分析次數、標簽調用次數來評估標簽的使用度;

標簽關註度評分:根據標簽搜索次數、標簽瀏覽次數、標簽收藏次數來評估標簽的關註度;

標簽質量評分:根據標簽值的覆蓋情況來評估標簽的質量,若null值過多,則說明標簽規則設置不合理;

標簽持續優化度評分:根據標簽上線後,再編輯優化的次數來評估標簽的持續優化情況;

標簽安全評分:根據標簽是否脫敏、是否設置行級許可權、是都需要申請、是否設置可見性來判斷標簽的安全度。

基於以上5個維度計算標簽的綜合評分,可查看各標簽的評分、評估標簽的重要性。

同時,基於標簽使用度評分、標簽關註度評分、標簽持續優化度評分來計算熱門標簽排行、沉默標簽排行,找出不太用的標簽進行下線,完成標簽的“定義——開發——上線——優化——下線”全生命周期管理。

第五步 標簽應用與迴流

標簽應用與迴流則是指標簽圈群、畫像洞察和對外服務幾項具體的落地結果操作,也是標簽建設必不可少的一環。

file
● 以一個場景舉例:

· 營銷策略:為維持老顧客的忠誠度,並引導現在購買初級產品的老客戶向高級產品進階,圈選出為“老顧客升級”用戶,為這些客戶發放高端產品的優惠券;

· 人群包選擇:“最近1年購買次數>=1”且“最近1年消費金額>=1000”且“性別=女”的客戶。

● 基於目前群組進行畫像洞察:

· 群組畫像:進一步分析“老客戶升級”這批用戶的會員等級、月消費支出、是否為活躍用戶等,進一步掌握群組特征,根據活動預算調整自己的營銷策略。

· 群組分析:圈選出一個“高端產品用戶”群組,監控每天忠實用戶的人數,看是不是有明顯波動,某些活動發放後,數據是否有提升;某個時間人數是否有驟減,保障群組的穩定持續上升。

· 群組交並差計算:分析“老顧客升級”群組與“高端客戶”的重合度,看是否有重覆人群,最終推送優惠券可進行策略調整,不針對這部分重合客戶進行本次推送。

確定好人群後,便可進行市場投放,看其對業務帶來的作用,除分析活動帶來的GMV、客單價提升外,我們也需要知道活動參與情況也是用戶行為數據的一種,需要將這些數據也迴流至數倉,生成新的標簽。

三、標簽體系在某基金的建設案例

在上文中我們介紹了標簽體系建設的方法論,如何將理論落地實踐,袋鼠雲數棧智能標簽產品給出了答案。

客戶數據洞察平臺(DataTag),通過標簽萃取、標簽管理、群組細分、全面畫像,構建以業務價值為導向的標簽體系和多樣化群組,將數據資產標簽化,數據標簽價值化,應用於企業智能化運營與營銷。

file
接下來我們以某基金客戶的案例,來為大家介紹標簽體系建設的實際應用。

1、項目背景

身處一個全方位數字化的平臺型經濟時代,企業的數字化轉型已是由內而外的必然趨勢,在數字化浪潮下,基金客戶的各項業務迅猛發展、客戶數據量急劇增長,公司對客戶、產品、渠道、反洗錢等方面的數據分析、運營提出了更高要求,在此背景下,搭建一套完整的標簽平臺,提升營銷效率,無疑是最佳的選擇。

2、客戶痛點

· 客戶數據分散在各個系統,無統一的分析平臺;

· 各類數據分析和提取大多採用半自動的工作模式,無科學的標簽體系;

· 客戶活動開發周期長,運營不精準,營銷效果缺乏及時追蹤、運行反饋不及時。

3、建設方案

· 對接星環 TDH引擎;

· 提供標簽實施服務,為客戶梳理標簽體系,完標簽開發,建立客戶標簽體系,支持銷售、服務、合規等不同角度的需求;

· 便捷的標簽開發、運算、展示和輸出等全生命周期管理;支持客戶個體及群組畫像、客戶群圈選和對比,支持快速推廣、智能營銷、精準服務。

file

4、建設流程

· 業務層面:以客戶實際業務現狀和業務需求為基礎,量身定製適用於業務的標簽體系;

· 數據層面:將各業務系統中消費者數據迴流至數據中台,根據標簽設計,進行數據探查、清洗、建模、開發等工作並實施上線。

file

5、業務效果

· 標簽體系:建立客戶、基金、基金經理、渠道 4 個標簽體系;

· 標簽數量:600 + 標簽;

· 加工效率:標簽加工效率從 1 周縮短到 2 天,運營效率提升至 2~3 次 / 周;

· 標簽應用:應用在基金營銷、反洗錢風險控制、用戶流失召回等多個方向。

file

袋鼠雲開源框架釘釘技術交流qun(30537511),歡迎對大數據開源項目有興趣的同學加入交流最新技術信息,開源項目庫地址:https://github.com/DTStack


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • webpack簡介 構建工具(基於Nodejs)node(v16)前端工程化。 環境搭建 創建一個空的package.json npm init webpack核心包(提供了API,插件) npm i webpack -g npm i webpack -D cnpm i webpack -g cnp ...
  • 在docker中拉取centos8鏡像,創建一個為centos8的容器,併在容器中編譯安裝apache,然後使用編製安裝完成的容器創建一個鏡像。測試是否能通過此鏡像部署一個web站點併成功訪問 ...
  • 1. TriCore與中斷的簡介 TriCore是德國英飛凌科技公司旗下的第一個為實時嵌入式系統而優化的統一的、32位的微控制器-DSP(Digital Signal Processing)處理器架構。TriCore的ISA(Instruction Set Architecture),即指令集體繫結 ...
  • 博德之門:黑暗聯盟2是一款原始畫風奇幻探索動作冒險游戲,商隊遇難,僅剩的守衛也已受傷,邪惡力量再次回到了傳說中的博德之門,玩家需要狡猾的戰士和大膽的法師從威脅所有人的黑魔法中奪回博德之門,快拿起你的武器參加戰鬥吧! 詳情:博德之門:黑暗聯盟2 for mac(迷宮探索游戲) 簡單介紹 在這個地牢爬行 ...
  • PreviewMarkdown Mac版是一款功能強大的Markdown編輯預覽軟體,為使用流行的 Markdown 標記格式創建的文檔提供 QuickLook 文件預覽和文件圖標縮略圖。 詳情:PreviewMarkdown for Mac(Markdown編輯預覽軟體) 簡單介紹 Preview ...
  • 定義: 刪除數據表就是將資料庫中已經存在的表從資料庫中刪除。註意,在刪除表的同時,表的定義和表中所有的數據均會被刪除。因此,在進行刪除操作前,最好對錶中的數據做一個備份,以免造成無法輓回的後果。本節將詳細講解資料庫表的刪除方法。 1 刪除一個或多個沒有被其他表關聯的數據表 如果一個數據表沒有和其它表 ...
  • Orange是提高工作便利性的 集成開發工具 可以極大方便資料庫管理和 用戶的數據訪問進程 Orange是 DB運營管理和開發解決方案 通過方便而又強大的功能 快速可視化編程前端 以便瀏覽數據分析和可視化 開發商介紹 Ware Valley成立於2001年,是一家全球性的軟體公司,也是南韓唯一一個為 ...
  • 更多技術交流、求職機會、試用福利,歡迎關註位元組跳動數據平臺微信公眾號,回覆【1】進入官方交流群 序言 埋點數據作為推薦、搜索、產品優化的基石,其數據質量的重要性不言而喻,而要保障埋點數據的質量,埋點驗證則首當其衝。工欲善其事必先利其器,要做好埋點驗證會面臨很多技術挑戰:易用性、準確性、實時性、穩定性 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...