Python使用RMF聚類分析客戶價值

来源:https://www.cnblogs.com/blogs/archive/2019/12/07/12003145.html
-Advertisement-
Play Games

投資機構或電商企業等積累的客戶交易數據繁雜。需要根據用戶的以往消費記錄分析出不同用戶群體的特征與價值,再針對不同群體提供不同的營銷策略。 用戶分析指標 根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標 R-最近一次消費(Rec ...


投資機構或電商企業等積累的客戶交易數據繁雜。需要根據用戶的以往消費記錄分析出不同用戶群體的特征與價值,再針對不同群體提供不同的營銷策略。

用戶分析指標

根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標

    R-最近一次消費(Recency)

    F-消費頻率(Frequency)

    M-消費金額(Monetary)


通過該圖將用戶進行分類:

    R、F、M都很高,重要價值客戶(VIP客戶)

    F、M很高,R不高,重要保持客戶

    R、F、M都很低,流失客戶

    M很高,R、F不高,重要輓留客戶

 

根據這8個類別的R、F、M指標,對用戶進行標註,哪些是重要價值客戶,哪些是重要保持客戶,哪些是重要發展客戶,哪些是流失客戶等

 

流程介紹

以R、F、M這三個核心指標為維度進行聚類分析

利用K-means聚類分析將用戶分類

根據R、F、M指標,對用戶進行標註

 

準備工作:
數據

     某電商企業客戶近期購買的數據。包含客戶註冊日期,最後購買日期以及購買消費總金額

 

參數:

R-求出最近一次投資時間距提數日天數

F-月均投資次數

M-月均投資金額


目標:分析客戶交易數據,用戶群體的特征與價值,進行精準營銷,降低營銷成本,提高銷售業績。

1  分析數據獲取RFM

R-求出最近一次投資時間距提數日天數

    確定一個提現日,減去用戶的最新投資日期

F-月均投資次數

    總投資次數/總月數

M-月均投資金額

    投資總金額/總月數

 

 

處理數據獲取R-F-M

def dataChange(data):
    deadline_time = datetime(2016,7,20)
    print(deadline_time)

    # 時間相減 得到天數查 timedelta64類型
    diff_R = deadline_time - data["最近一次投資時間"]

    # 渠道具體天數
    # days = diff_R[0].days
    R = []
    for i in diff_R:
        days = i.days
        R.append(days)

    print(R)
    '''
    用戶在投時長(月
    Python沒有直接獲取月數差的函數
    1、獲取用戶在投天數
    2、月=在投天數/30,向上取整
    '''
    diff = deadline_time - data["首次投資時間"]
    print(diff)

    # 利用向上取整函數
    months = []
    for i in diff:
        month = ceil(i.days/30)
        months.append(month)

    print(months)

    # 月均投資次數
    month_ave = data["總計投標總次數"]/months
    F = month_ave.values
    print(F)

    # 月均投資金額
    M = (data["總計投資總金額"]/months).values
    print(M)

    return R, M, F

 2 訓練KMeans模型

先對數據進行轉換,然後通過K—Means模型訓練,生產模型

def analy_data(data, R, M, F):
    cdata = DataFrame([R, list(F), list(M)]).T
    # 指定cdata的index和colums
    cdata.index = data.index
    cdata.columns = ["R-最近一次投資時間距提數日的天數", "F-月均投資次數", "月均投資金額"]
    print("cdata_info:\n", cdata)

    print("cdata:\n", cdata.describe())

    # K-Means聚類分析

    # 01 數據標準化  均值:cdata.mean()   標準差:cdata.std()
    # 對應位置分別先相減 再相除
    zcdata = (cdata-cdata.mean())/cdata.std()
    print("zcdata:\n", zcdata)

    # n_clusters:分類種數  n_jobs:計算的分配資源  max_iter:最大迭代次數  random_state:隨機數種子,種子相同,參數固定
    kModel = KMeans(n_clusters=4, n_jobs=4, max_iter=100, random_state=0)
    kModel.fit(zcdata)
    print(kModel.labels_)

 

3  通過模型對用戶標註

   # 統計每個類別的頻率
    value_counts = Series(kModel.labels_).value_counts()
    print(value_counts)

    # 將類別標簽賦回原來的數據
    cdata_rst = pd.concat([cdata, Series(kModel.labels_, index=cdata.index)], axis=1)
    print(cdata_rst)

    # 命名最後一列為類別
    cdata_rst.columns = list(cdata.columns) + ["類別"]
    print(cdata_rst)

    # 按照類別分組統計R, F, M的指標均值
    user_ret = cdata_rst.groupby(cdata_rst["類別"]).mean()
    print(user_ret)

 

'''

        R-最近一次投資時間距提數日的天數   F-月均投資次數         月均投資金額
類別
0 27.859375 2.820312 21906.754297
1 20.684211 4.552632 115842.105263
2 10.568182 5.579545 26984.313636
3 12.111111 17.277778 107986.000000

結論:
類別3:R、F、M都比較高,屬於重要價值客戶 或 超級用戶
類別0:R、F、M都比較低,屬於低價值客戶
類別1:R一般、F一般、M很高,也屬於重要價值客戶

'''

通過模型對新用戶標註

1、獲取新用戶數據

2、通過和原數據處理獲取RFM

3、通過訓練模型得出用戶類型

def user_classes(cdata, user_info):
    '''
    # 模擬一條用戶數據
    1、獲取當前時間表示為截止時間
    2.計算出: R F M

    '''
    R, M, F = user_info_change(user_info)
    user_data_info = DataFrame([[R], [F], [M]]).T
    print(user_data_info)

    # user_data_info = DataFrame([[12.5], [18.0], [20000.0]]).T
    user_data_info.index = ["lily"]
    user_data_info.columns = cdata.columns
    print("cdata_info:\n", user_data_info)

    new_zcdata = (user_data_info-cdata.mean())/cdata.std()
    print("new_zcdata", new_zcdata)

    kModel = load_model("user_classes.pkl")
    ret = kModel.predict(new_zcdata)
    print("new_zcdata_ret:", ret)
    # new_zcdata_ret: [3]

 









您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 編程只是 if ; 為了少寫重覆的代碼,有了迴圈 for/while; 但碰到很長的重覆代碼,可能用一個迴圈難以實現,所以出現了面向對象的思想: 類:就是你的迴圈主體 實例:就是對你的迴圈的一次調用 概念: 1. 在Python中,首字母大寫的,名稱指的是類。這個類定義中的括弧是空的 2. 類包括 ...
  • 本人第一次寫博客,之前都是用自己的日記本。 但是苦於不能時時帶著電腦,實在是不方便。。。。所以決定用手機。正好就是朋友也都在用博客,所以,,真香。。。 廢話不多說,點到為止。。 原理:比較兩個相鄰的元素,將值大的元素交換至右端。 冒泡排序的優點:每進行一趟排序,就會少比較一次,因為每進行一趟排序都會 ...
  • 大家好,歡迎來到樂位元組小樂的Java技術分享園地。這次給大家分享的是Tomcat 一. 什麼是 Tomcat Tomcat 是一個符合 JavaEE WEB 標準的最小的 WEB 容器,所有的 JSP 程式一定要有 WEB 容器的支持才能運行,而且在給定的 WEB 容器裡面都會支持事務處理操作。 T ...
  • 利用JavaFX設計一個井字棋游戲,其中包括了能夠與玩家對戰的AI。AI的實現相比五子棋來說要簡單得多,可以保證AI在後手情況下絕對不會輸,具體實現如下: /* * To change this license header, choose License Headers in Project Pr ...
  • 說在前面 我覺得沒有什麼錯誤是調試器無法解決的,如果沒有,那我再說一遍,如果有,那當我沒說 一、拋出異常 可以通過 raise 語句拋出異常,使程式在我們已經知道的缺陷處停下,併進入到 except 語句 raise句法: raise關鍵字 調用的異常函數名 ValueError (這個函數必須是異 ...
  • 一.賦值即定義 1.運行以下代碼會出現報錯 2.使用global關鍵字解決以上報錯 3.不推薦使用global global總結 x+=1這種是特殊形式產生的錯誤的原因?先引用後賦值,而python動態語言是賦值才算定義,才能被引用。解決辦法,在這條語句前增加x=0之類的賦值語句,或者使用globa ...
  • 作者:陳皓 (@左耳朵耗子) | 編輯:玲玲 來源:https://dwz.cn/YELpxqyC 對,你沒看錯,本文就是教你怎麼寫出讓同事無法維護的代碼。 一、程式命名 1、容易輸入的變數名。比如:Fred,asdf 2、單字母的變數名。比如:a,b,c, x,y,z(如果不夠用,可以考慮a1,a ...
  • 1 開發需要環境 工欲善其事,必先利其器。在正式開發之前我們檢查好需要安裝的拓展,不要開發中發現這些問題,打斷思路影響我們的開發效率。 安裝 swoole 拓展包 安裝 redis 拓展包 安裝 laravel5.5 版本以上 如果你還不會用swoole就out了 2 Laravel 生成命令行 p ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...