讀書筆記：推薦系統實踐-第五章-利用上下文信息

原創

2019-04-25 08:18

1、時間上下文信息

1.1 時間效應簡介

時間信息對用戶興趣的影響主要表現在以下幾個方面：

用戶興趣是變化的，應該關注用戶最近的行爲
物品也是有生命週期的
季節效應，節日也是

1.2 系統時間特性的分析

包含時間信息的用戶行爲數據集由一系列三元組構成，其中每個三元組(u,i,t)代表了用戶u在時刻t對物品i產生過行爲
可以通過統計如下信息研究系統的時間特性

數據集每天獨立用戶數的增長情況
系統的物品變化情況，這個可以使用以下指標來探查
- 物品平均在線天數：如果一個物品在某天被至少一個用戶產生過行爲，就定義該物品在這一天在線
- 相隔T天系統物品流行度向量的平均相似度
用戶訪問情況

1.3 推薦系統的實時性

對用戶行爲的存取有實時性要求
推薦算法本身具有實時性
- 要求在每個用戶訪問推薦系統時，都根據用戶這個時間點前的行爲實時計算推薦列表
- 推薦算法需要平衡考慮用戶的近期行爲和長期行爲

1.4 推薦算法的時間多樣性

推薦系統每天推薦結果的變化程度被定義爲推薦系統的時間多樣性
保證時間多樣性可以提升用戶的滿意度
解決方法可以被分爲兩步：
- 需要保證推薦系統能夠在用戶有了新的行爲後及時調整推薦結果，使推薦結果滿足用戶最近的興趣
  - 每天離線生成推薦結果，那麼就無法做到實時
  - 不同實時推薦算法有不同的時間多樣性
- 需要保證推薦系統在用戶沒有新的行爲時也能夠經常變化一下結果，具有一定的時間多樣性
  - 在生成推薦結果時加入一定的隨機性
  - 對推薦過的結果降權
  - 每天給用戶使用不同的推薦算法
推薦系統需要首先保證推薦的精度，在此基礎上適當地考慮時間多樣性

1.5 時間上下文推薦算法

1.5.1 最近最熱門

給用戶推薦歷史上最熱門的物品

1.5.2 時間上下文相關的ItemCF算法

計算步驟
- 利用用戶行爲離線計算物品之間的相似度
- 根據用戶的歷史行爲和物品相似度矩陣，給用戶做在線個性化推薦
時間效應需要關注的點
- 物品相似度用戶在相隔很短的時間內喜歡的物品具有更高相似度。
- 在線推薦用戶近期行爲相比用戶很久之前的行爲，更能體現用戶現在的興趣。
相似度計算公式
計算用戶u對物品i的興趣p（u,i)，控制用戶現在的行爲應該和用戶最近的行爲關係更大。

1.5.3 時間上下文相關的UserCF算法

時間效應需要關注的點
- 用戶興趣相似：在同一時間喜歡的物品相似的用戶之間興趣更相似
- 相似新區用戶的最近行爲更接近用戶可能感興趣的內容
計算相似度的公式
計算興趣程度

1.6 時間段圖模型

圖表現
推薦算法：路徑融合
- 首先提取出兩個頂點之間長度小於一個閾值的所有路徑
- 然後根據每條路徑經過的頂點給每條路徑賦予一定的權重
- 最後將兩個頂點之間所有路徑的權重之和作爲兩個頂點的相關度

1.7 離線模型

當時效性要求比較高時，考慮時間因素的算法效果更好。

Pop 給用戶推薦當天最熱門的物品
TItemCF 融合時間信息的ItemCF算法
TUserCF 融合時間信息的UserCF算法
ItemCF 不考慮時間信息的ItemCF算法
UserCF 不考慮時間信息的UserCF算法
SGM 時間段圖模型
USGM 物品時間節點權重爲0的時間段圖模型
ISGM 用戶時間節點權重爲0的時間段圖模型

2、地點上下文信息

用戶興趣和地點相關的兩種特徵
- 不同地方的用戶興趣存在着很大的差別。
- 一個用戶往往在附近的地區活動。
基於位置的推薦算法
- 數據字段：（用戶，用戶位置，物品，評分）
  - 將數據集根據用戶位置劃分成爲樹狀結構，對所有包含該位置的葉節點的父節點訓練推薦模型，然後根據這些推薦結果加權之後進行推薦
- 數據字段：（用戶，物品，物品位置，評分）
  - 利用ItemCF計算用戶的喜愛程度，再加上一個距離懲罰項
    
    爲了避免計算用戶對所有物品的TravelPenalty，LARS在計算用戶u對物品i的興趣度 RecScore(u,i)時，首先對用戶每一個曾經評過分的物品（一般是餐館、商店、景點），找到和他距離小於一個閾值d的所有其他物品，然後將這些物品的集合作爲候選集，然後再利用上面的公式計算最終的RecScore。
從實踐的結果來看，上面兩者的算法都要優於普通的itemCF算法

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【推薦系統】Graph Embedding系列之node2vec: Scalable Feature Learning for Networks

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-08 12:03:46

【推薦系統】Graph Embedding系列之LINE

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-07 05:01:39

【推薦系統】Graph Embedding系列之DeepWalk

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-07 05:01:39

推薦系統系列（二）：從零開始搭建基於向量的推薦策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

精讀 An LSTM-Based Dynamic Customer Model for Fashion Recommendation 總結

精讀 An LSTM-Based Dynamic Customer Model for Fashion Recommendation 總結研究成果1. 前言2. 研究內容2.1 數據描述2.2 Fashion DNA的生成（商品表

2020-07-08 10:45:04

獨孤九劍：算法模型訓練的一般流程

這篇文章主要分享一下模型訓練的一般流程，目的是讓大家明白做一個算法模型過程中會涉及的流程和數據特徵在算法模型中的重要性。作爲一名算法工程師訓練模型可謂是家常便飯，不管是做推薦中的召回模型、排序模型還是其他領域的分類模型等，都應該

2020-07-08 09:19:54

讀書筆記：推薦系統與深度學習-第五章-混合推薦系統

1 什麼是混合推薦系統目前介紹的算法各有利弊：基於內容的推薦方法：一類item的特徵描述協同過濾：利用user和item的特定類型的信息轉化生成推薦結果社交網絡的推薦算法：根據user的相互影響關係進行推薦所以，希望構

2020-07-08 05:02:59

混合推薦總結

混合推薦系統是推薦系統的另一個研究熱點，它是指將多種推薦技術進行混合相互彌補缺點，從而可以獲得更好的推薦效果。最常見的是將協同過濾技術和其他技術相結合，克服cold start的問題。（1）加權型就是將多種推薦技術的計算結果加權混

2020-07-07 19:13:06

2018_WWW_DKN- Deep Knowledge-Aware Network for News Recommendation閱讀筆記

Xmind思維導圖： deep knowledge-aware network(DKN) properties： incorporates knowledge graph representation into news r

2020-07-07 06:54:41

基於用戶的協同過濾算法(UserCF)

用戶相似度計算協同過濾算法主要利用行爲的相似度計算興趣的相似度。給定用戶和用戶，令表示用戶感興趣的物品集合，令爲用戶感興趣的物品集合。那麼我們可以通過公式或者餘弦公式來計算用戶 , 的相似程度：假設目前共有

2020-07-07 02:47:53

基於物品的協同過濾算法(ItemCF)

物品相似度計算餘弦相似度公式：其中，分別表示對物品，喜歡的用戶數，爲同時喜歡和的人數。我們這裏還是使用漫威英雄舉例：假設目前共有5個用戶： A、B、C、D、E；共有5個漫威英雄人物：死侍、鋼鐵俠、美國隊長、黑豹、蜘蛛俠。用戶與

2020-07-07 02:47:43

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

https://arxiv.org/pdf/1906.04365.pdf 背景以往的點擊率預估模型像FM系列、WDN等模型，都只是考慮特徵和ctr之間的聯繫，阿里的這篇論文，提出了DeepMCP模型，不僅考慮了特徵和ctr之間

2020-07-07 01:30:56

PageRank總結&python實現

本文將記錄在學習pagerank的有關內容，如果您也在做相關的工作請與我郵件溝通交流 [email protected] 文章目錄pagerank理論及推導計算PageRank涉及到的數學內容馬爾科夫過程p

2020-07-07 01:24:52

畢業設計-mahout實現基於用戶的協同過濾算法和基於物品的協同過濾算法之java實現（mysql）

簡介： Mahout 是 Apache Software Foundation（ASF）旗下的一個開源項目，提供一些可擴展的機器學習領域經典算法的實現，旨在幫助開發人員更加方便快捷地創建智能應用程序。Mahout包含許多實現，包括聚類、

2020-07-06 22:44:19

冷啓動問題——協同過濾（推薦系統）

冷啓動問題——協同過濾（推薦系統）1. 什麼是冷啓動問題2. 協同過濾2.1 User CF2.2 Item CF 1. 什麼是冷啓動問題冷啓動問題：推薦系統需要根據用戶的歷史行爲和興趣預測用戶未來的行爲和興趣。這類問題主要

2020-07-06 22:14:00

24小時熱門文章

最新文章

最新評論文章