隨機森林 - 壽險客戶信息分析

来源:http://www.cnblogs.com/okokok/archive/2016/12/04/6104824.html
-Advertisement-
Play Games

註: 出於職業要求, 本文中所有數字均被人為修改過, 並非真實數字, 很抱歉也不能貼出源代碼 目標: 個險客戶特征分析 背景: 目前市場部使用的推廣活動分析系統只能針對客戶調查返回的信息分析,且僅有年齡/性別/婚姻狀態/收入四個維度, 預測精度不高. 市場部希望能從現有的壽險客戶信息分析出影響他們選 ...


註:  出於職業要求, 本文中所有數字均被人為修改過, 並非真實數字, 很抱歉也不能貼出源代碼

 

目標:

    個險客戶特征分析

 

背景:

    目前市場部使用的推廣活動分析系統只能針對客戶調查返回的信息分析,且僅有年齡/性別/婚姻狀態/收入四個維度, 預測精度不高.  市場部希望能從現有的壽險客戶信息分析出影響他們選擇保險產品的關鍵因素, 藉此更有針對性地改進市場推廣活動

建模過程:

輸入: 從現有上千萬的客戶信息抽取其個人信息, 清洗後留下100多個特征, 包括婚姻, 年齡, 收入, 身高體重, 職業風險度, 居住區等.  用現有產品的類別作為分類信息, 包括儲蓄險, 終身險, 定期險, 投資險等.

 

演算法:

    首先使用決策樹作粗略的預測檢驗輸入數據的有效性,使用隨機森林輸出重要的特征

    決策樹的優點在於直觀, 容易實現, 並且能同時處理離散型和連續型變數, 過程中添加變數的改動也不大. 從數據中抽取了一年的客戶信息作為訓練集, 建立決策樹來預測客戶選擇的保險產品類別.

結果分析:

第一次運行命中率只有40%, 分析其混淆矩陣:

 

 

可以看出, 決策樹在最後一個分類的效果很差, 可以說沒有效果,在第三第四個分類上區分度也不高.  

最後一個分類是投資險, 說明現有客戶特征並不能滿足投資險種分類的區別, 需要添加特征值

第三,四個分類其實都是定期險, 一種是繳費年限定期, 另一種是被保年齡定期, 本質上區別不大,可以合併起來

暫時過濾掉投資險客戶信息, 合併定期險客戶信息後, 重運行的混淆矩陣

 

 

可以看到分類已經有所改進了, 命中率可以達到60%

二三四分類的區分度看上去已經不錯了, 唯有第一類儲蓄險種區分度不高, 把這部分客戶信息過濾掉之後, 就可以達到不錯的命中率了.

 

隨機森林相比決策樹的優點除了準確率高之外, 更重要的是它能夠給出哪些feature比較重要! 而這正好就是市場部分所需要的東西. 

 

最終結果顯示, 在過去的10年中, 客戶的婚姻狀態/年齡/身高體重對客戶的保險產品選擇貢獻度最高.

 

模型的結果最終會在Tableau上顯示:

如特征值貢獻度走勢

 

 重要特征分類下的保單數統計

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 今天碰到了在XML中應用以內部類形式定義的自定義view,結果遇到了一些坑。雖然通過看了一些前輩寫的文章解決了這個問題,但是我看到的幾篇都沒有完整說清楚why,於是決定做這個總結。 使用自定義內部類view的規則 本文主要是總結why,所以先把XML佈局文件中引用內部類的自定義view的做法擺出來, ...
  • 三級緩存的提出就是為了提升用戶體驗。當我們第一次打開應用獲取圖片時,先到網路去下載圖片,然後依次存入記憶體緩存,磁碟緩存,當我們再一次需要用到剛纔下載的這張圖片時,就不需要再重覆的到網路上去下載,直接可以從記憶體緩存和磁碟緩存中找,由於記憶體緩存速度較快,我們優先到記憶體緩存中尋找該圖片,如果找到則運用,如 ...
  • 最近解決了一個Android APP的bug,發現APP在被後臺清理後,會自動重啟。現象很奇怪,有的手機(HTC)後臺清理後,程式會再次重啟,而有的手機(小米)則不會。猜想可能是小米手機內部做了處理,當執行後臺清理後,對應的APP不會再重啟了。 Debug後發現,APP內部有一個Service,在S ...
  • 散列表的具體實現就不多做介紹了,就是一個數組,每個下標存儲的是碰撞的元素的鏈表頭指針,如下圖所示: 下麵直接研究對用鏈接法散列的分析: 給定一個能存放n個元素的、具有m個槽位的散列表T,定義T的裝載因數α為n/m,即一個鏈中平均存儲的元素數。 用鏈接法散列的最壞情況性能很差:所有的n個關鍵字都散列到 ...
  • 之前關於如何實現屏幕頁面切換,寫過一篇博文《Android中使用ViewFlipper實現屏幕切換》,相比ViewFlipper,ViewPager更適用複雜的視圖切換,而且Viewpager有自己的adapter,這也讓其適應複雜對象,實現數據的動態載入。 ViewPager是谷歌官方給我們提供的 ...
  • 一、分析目的 為企業戰略決策、投資決策、營銷決策提供依據 二、分析思路 三、分析方法——廚藝大比拼 數據分析的過程 對比 分類 相關:相關分析研究的是事物間的某種聯繫,最常見的聯繫就是因果分析。 分佈:分佈分析就是集中和離散趨勢。 四、分析應用 巨集觀環境:PEST分析——政治(Political)環 ...
  • 我們在數據分析之前需要進行數據處理、數據錄入並把數據清洗乾凈,做好數據的加工和描述工作。 【參考文獻】《數據分析:企業的賢內助》 陳哲 著 ...
  • 統計某一特定網站的某個時辰訪客人數 所用版本:hadoop2.6.5 數據樣式如下: 輔助類 mapper 映射特定年份中每月每天每個時辰的訪客數 reducer 彙總一個時辰內訪客人數 driver 配置信息,程式入口 command result ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...