隨機森林 - 壽險客戶信息分析

-Advertisement-

註: 出於職業要求, 本文中所有數字均被人為修改過, 並非真實數字, 很抱歉也不能貼出源代碼目標: 個險客戶特征分析背景: 目前市場部使用的推廣活動分析系統只能針對客戶調查返回的信息分析,且僅有年齡/性別/婚姻狀態/收入四個維度, 預測精度不高. 市場部希望能從現有的壽險客戶信息分析出影響他們選 ...

註: 出於職業要求, 本文中所有數字均被人為修改過, 並非真實數字, 很抱歉也不能貼出源代碼

目標:

個險客戶特征分析

背景:

目前市場部使用的推廣活動分析系統只能針對客戶調查返回的信息分析,且僅有年齡/性別/婚姻狀態/收入四個維度, 預測精度不高. 市場部希望能從現有的壽險客戶信息分析出影響他們選擇保險產品的關鍵因素, 藉此更有針對性地改進市場推廣活動

建模過程:

輸入: 從現有上千萬的客戶信息抽取其個人信息, 清洗後留下100多個特征, 包括婚姻, 年齡, 收入, 身高體重, 職業風險度, 居住區等. 用現有產品的類別作為分類信息, 包括儲蓄險, 終身險, 定期險, 投資險等.

演算法:

首先使用決策樹作粗略的預測檢驗輸入數據的有效性,使用隨機森林輸出重要的特征

決策樹的優點在於直觀, 容易實現, 並且能同時處理離散型和連續型變數, 過程中添加變數的改動也不大. 從數據中抽取了一年的客戶信息作為訓練集, 建立決策樹來預測客戶選擇的保險產品類別.

結果分析:

第一次運行命中率只有40%, 分析其混淆矩陣:

可以看出, 決策樹在最後一個分類的效果很差, 可以說沒有效果,在第三第四個分類上區分度也不高.

最後一個分類是投資險, 說明現有客戶特征並不能滿足投資險種分類的區別, 需要添加特征值

第三,四個分類其實都是定期險, 一種是繳費年限定期, 另一種是被保年齡定期, 本質上區別不大,可以合併起來

暫時過濾掉投資險客戶信息, 合併定期險客戶信息後, 重運行的混淆矩陣

可以看到分類已經有所改進了, 命中率可以達到60%

二三四分類的區分度看上去已經不錯了, 唯有第一類儲蓄險種區分度不高, 把這部分客戶信息過濾掉之後, 就可以達到不錯的命中率了.

隨機森林相比決策樹的優點除了準確率高之外, 更重要的是它能夠給出哪些feature比較重要! 而這正好就是市場部分所需要的東西.

最終結果顯示, 在過去的10年中, 客戶的婚姻狀態/年齡/身高體重對客戶的保險產品選擇貢獻度最高.

模型的結果最終會在Tableau上顯示:

如特征值貢獻度走勢

重要特征分類下的保單數統計

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Android XML中引用自定義內部類view的四個why

今天碰到了在XML中應用以內部類形式定義的自定義view，結果遇到了一些坑。雖然通過看了一些前輩寫的文章解決了這個問題，但是我看到的幾篇都沒有完整說清楚why，於是決定做這個總結。使用自定義內部類view的規則本文主要是總結why，所以先把XML佈局文件中引用內部類的自定義view的做法擺出來， ...
關於Android中的三級緩存

三級緩存的提出就是為了提升用戶體驗。當我們第一次打開應用獲取圖片時，先到網路去下載圖片，然後依次存入記憶體緩存，磁碟緩存，當我們再一次需要用到剛纔下載的這張圖片時，就不需要再重覆的到網路上去下載，直接可以從記憶體緩存和磁碟緩存中找，由於記憶體緩存速度較快，我們優先到記憶體緩存中尋找該圖片，如果找到則運用，如 ...
解決Android後臺清理APP後，程式自動重啟的問題

最近解決了一個Android APP的bug，發現APP在被後臺清理後，會自動重啟。現象很奇怪，有的手機（HTC）後臺清理後，程式會再次重啟，而有的手機（小米）則不會。猜想可能是小米手機內部做了處理，當執行後臺清理後，對應的APP不會再重啟了。 Debug後發現，APP內部有一個Service，在S ...
散列表的數學分析（精解）--通過鏈表法解決碰撞

散列表的具體實現就不多做介紹了，就是一個數組，每個下標存儲的是碰撞的元素的鏈表頭指針，如下圖所示：下麵直接研究對用鏈接法散列的分析：給定一個能存放n個元素的、具有m個槽位的散列表T，定義T的裝載因數α為n/m，即一個鏈中平均存儲的元素數。用鏈接法散列的最壞情況性能很差：所有的n個關鍵字都散列到 ...
Android中使用ViewPager實現屏幕頁面切換和頁面切換效果

之前關於如何實現屏幕頁面切換，寫過一篇博文《Android中使用ViewFlipper實現屏幕切換》，相比ViewFlipper，ViewPager更適用複雜的視圖切換，而且Viewpager有自己的adapter，這也讓其適應複雜對象，實現數據的動態載入。 ViewPager是谷歌官方給我們提供的 ...
（七）教你數據分析烹飪大法，做出美味佳餚

一、分析目的為企業戰略決策、投資決策、營銷決策提供依據二、分析思路三、分析方法——廚藝大比拼數據分析的過程對比分類相關：相關分析研究的是事物間的某種聯繫，最常見的聯繫就是因果分析。分佈：分佈分析就是集中和離散趨勢。四、分析應用巨集觀環境：PEST分析——政治（Political）環 ...
（六）數據處理——錄入、清洗、加工、描述

我們在數據分析之前需要進行數據處理、數據錄入並把數據清洗乾凈，做好數據的加工和描述工作。【參考文獻】《數據分析：企業的賢內助》陳哲著 ...
一個典型的MapRuduce實例------webcount（網站統計訪客信息）

統計某一特定網站的某個時辰訪客人數所用版本：hadoop2.6.5 數據樣式如下：輔助類 mapper 映射特定年份中每月每天每個時辰的訪客數 reducer 彙總一個時辰內訪客人數 driver 配置信息，程式入口 command result ...