《推薦系統實踐》—— 讀後總結

来源:http://www.cnblogs.com/xing901022/archive/2017/02/03/6362295.html
-Advertisement-
Play Games

在剛剛畢業的時候,當時的領導就問了一個問題——個性化推薦與精準營銷的區別,當時朦朦朧朧回答不出。現在想想,他們可以說是角度不同。精準營銷可以理解為幫助物品尋找用戶,而個性化推薦則是幫助用戶尋找物品。 什麼是推薦系統? 那麼什麼是推薦系統呢?簡單的來說,就是幫助用戶和物品聯繫起來,讓信息展現在對他感謝 ...


在剛剛畢業的時候,當時的領導就問了一個問題——個性化推薦與精準營銷的區別,當時朦朦朧朧回答不出。現在想想,他們可以說是角度不同。精準營銷可以理解為幫助物品尋找用戶,而個性化推薦則是幫助用戶尋找物品。

什麼是推薦系統?

那麼什麼是推薦系統呢?簡單的來說,就是幫助用戶和物品聯繫起來,讓信息展現在對他感謝興趣的用戶面前。

在互聯網最開始興起的時候,最便捷的幫助用戶的方法就是進行分類,比如當時的雅虎,hao123等等。後來互聯網興起,這種分類已經裝不下太多的信息,於是出現了搜索引擎,當用戶需要什麼東西的時候,可以直接主動的去獲取。而推薦系統的出現,則幫助用戶在沒有明確的目的時,根據行為歷史或者用戶信息為用戶提供有價值的東西。

所以一個完整的推薦系統需要包括前段的展示頁面,後臺的日誌系統以及良好的推薦演算法。

個性化的推薦系統應用

現在個性化推薦已經應用的很廣泛了,比如:

  • 1 電子商務網站、亞馬遜:個性化推薦、相關推薦(打包和相似產品)
  • 2 電影和視頻網站,Netflix,YouTube,Hulu:基於物品用戶評分進行推薦
  • 3 個性化音樂網路電臺:音樂推薦難度比較大,因為考慮到用戶的心情、音樂很短、免費等等
  • 4 社交網路:facebook,用戶之間的網路關係、用戶的偏好關係
  • 5 個性化閱讀:Google Reader,Digg
  • 6 基於位置的服務:基於地理位置推送飯店
  • 7 個性化郵件:幫助篩選出優先順序高的郵件
  • 8 個性化廣告:CPM按照看到廣告的次數收費、CPC按照點擊廣告的次數收費 、CPA按照最後的訂單收費,個性化推薦幫助用戶找到他們感興趣的東西;廣告推薦幫助廣告找到對他們感興趣的用戶。
    主要包括:上下文廣告(通過用戶瀏覽的內容)、搜索廣告、個性化展示

基於行為數據

大多數的推薦系統都是基於用戶行為的,當你瀏覽了一款商品,推薦列表將會更新,推薦一些與你瀏覽產品相關或者類似的產品。

常見的推薦演算法就時基於用戶或者物品的協同過濾。

  • 基於用戶的協同過濾,userCF,即會搜索你的好友喜歡的東西推薦給你
  • 基於物品的協同過濾,itemCF,即搜索您喜歡的物品相類似的東西推薦給你

這兩種演算法都有各自的使用場景的優劣勢。

推薦系統冷啟動

對於很多公司都是在一定規模才引入推薦系統的,這時候已經擁有了大量的用戶行為數據,做推薦演算法就很容易了。但是有一些系統想在初期就引入,這就比較困難了。因為既沒有大量的物品,也沒有太多的用戶關係,做協同過濾就很費勁了。

因此可以考慮費個性化的推薦,比如熱門排行、利用用戶的註冊信息、社交賬號、反饋信息等進行推薦。之後再慢慢調整..

在系統的初期也可以考慮選擇合適的物品啟動用戶的興趣,需要有比較熱門、代表性和區分行。

利用用戶標簽數據

基於標簽是一種很簡單很暴力的推薦方法,給用戶打上相關的標簽,然後就可以基於標簽進行精準營銷或者個性化推薦了。

一般打上的標簽都是 物品定義、種類、所有者、觀點、用戶胡哦哦相關的。也可以分成:類型、時間、人物、地點、語言、等等

一般的標簽都是由三元組組成(用戶、物品、標簽)

在打標簽的時候還需要註意標簽的清理。

利用上下文信息

因為用戶的興趣是變化的,可能隨著季節的效應而變化(比如衣服、考試資料),也可能根據購買的歷史(比如你買了一樣東西,以後就再也不需要買了)。

因此時間是一個很重要的上下文環境,另外就是地理位置,比如吃飯、逛街等等。

數據挖掘、機器學習、深度學習的含義

數據挖掘:

data mining,是一個很寬泛的概念。字面意思就是從成噸的數據裡面挖掘有用的信息。這個工作BI(商業智能)可以做,數據分析可以做,甚至市場運營也可以做。你用excel分析分析數據,發現了一些有用的信息,然後這些信息可以指導你的business,恭喜你,你已經會數據挖掘了。

機器學習:

machine learning,是電腦科學和統計學的交叉學科,基本目標是學習一個x->y的函數(映射),來做分類或者回歸的工作。之所以經常和數據挖掘合在一起講是因為現在好多數據挖掘的工作是通過機器學習提供的演算法工具實現的,例如廣告的ctr預估,PB級別的點擊日誌在通過典型的機器學習流程可以得到一個預估模型,從而提高互聯網廣告的點擊率和回報率;個性化推薦,還是通過機器學習的一些演算法分析平臺上的各種購買,瀏覽和收藏日誌,得到一個推薦模型,來預測你喜歡的商品。

深度學習:

deep learning,機器學習裡面現在比較火的一個topic(大坑),本身是神經網路演算法的衍生,在圖像,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。

總結下,數據挖掘是個很寬泛的概念,數據挖掘常用方法大多來自於機器學習這門學科,深度學習是機器學習一類比較火的演算法,本質上還是原來的神經網路。



您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 資料庫基本概念">關係型資料庫基本概念 資料庫: 對大量信息進行管理的高效解決方案。 按照數據結構來組織、存儲和管理數據的庫。 資料庫系統(DBS,DATABASE SYSTEM): 資料庫(DB,DATABASE) + 資料庫管理系統(DBMS,DATABASE MANAGEMENT SYSTEM ...
  • 第一範式:確保每列的原子性. 如果每列(或者每個屬性)都是不可再分的最小數據單元(也稱為最小的原子單元),則滿足第一範式. 例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。第二範式:在第一範式的基礎上更進一層,目標是確保表中的每列都和主鍵相關. 如果一個關係滿足第 ...
  • 年後回來查看mysql運行狀況與備份情況,登錄mysql從庫查看主從同步狀態 突然之間Slave_IO_Running: 狀態變成NO了 解決方法。 首先在從庫上執行 stop slave; 查看主庫master狀態 刷新binlog日誌 flush logs; 刷新後的日誌會+1 例如上面的 Fi ...
  • 資料庫設計範式 什麼是範式:簡言之就是,資料庫設計對數據的存儲性能,還有開發人員對數據的操作都有莫大的關係。所以建立科學的,規範的的資料庫是需要滿足一些 規範的來優化數據數據存儲方式。在關係型資料庫中這些規範就可以稱為範式。 什麼是三大範式: 第一範式:當關係模式R的所有屬性都不能在分解為更基本的數 ...
  • 本文主要記錄了安裝hadoop集群前的準備工作以及hdfs+yarn+zookeeper的搭建 ...
  • 一、mysql管理指令 /Applications/XAMPP/xamppfiles/bin/mysql -uroot 1.顯示所有的庫 SHOW DATABASES; 2.進入mysql庫 USE mysql; 3.顯示當前顯示的庫 SELECT DATABASE(); 4.顯示當前庫中所有表名稱 ...
  • 一、Oracle 註意Oracle分成兩個文件,下載完後,將兩個文件解壓到同一目錄下即可。 路徑名稱中,最好不要出現中文,也不要出現空格等不規則字元。 官方下地址: http://www.oracle.com/technetwork/database/enterprise-edition/downl ...
  • 類別 「網站分類」SQL Server SQLServer行版本控制 一併發控制 1.1併發控制定義 併發控制分為樂觀併發控制和悲觀併發控制這2種併發控制模型,如果2個進程試圖在同一時刻修改同一數據時都會發生衝突。區別在於,悲觀併發是在衝突前進行防止,樂觀併發是在發生後採用某種方法來處理衝突。 1. ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...