推薦引擎(一)

信息發現

推薦系統,與搜索引擎對應,又稱爲推薦引擎。隨着推薦引擎的出現,用戶獲取信息的方式從簡單的目標明確的數據的搜索轉換到更高級更符合人們使用習慣的信息發現。

推薦引擎

推薦引擎利用特殊的信息過濾技術,將不同的物品或內容推薦給可能對它們感興趣的用戶。

元數據:例如關鍵字,基因描述等; 系統用戶的基本信息,例如性別,年齡等 用戶對物品或者信息的偏好,根據應用本身的不同,可能包括用戶對物品的評分,用戶查看物品的記錄,用戶的購買記錄等。

用戶偏好信息:1.顯式的用戶反饋:例如用戶對物品的評分,或者對物品的評論。2.隱式的用戶反饋:例如用戶購買了某物品,用戶查看了某物品的信息等等。

推薦引擎的分類

根據推薦引擎是不是爲不同的用戶推薦不同的數據,推薦引擎可以分爲基於大衆行爲的推薦引擎(對每個用戶都給出同樣的推薦)和個性化推薦引擎(對不同的用戶,根據他們的口味和喜好給出更加精確的推薦)。從根本上說,只有個性化的推薦引擎纔是更加智能的信息發現過程。

(1) 根據系統用戶的基本信息發現用戶的相關程度,這種被稱爲基於人口統計學的推薦(Demographic-based Recommendation)。

(2) 根據推薦物品或內容的元數據,發現物品或者內容的相關性,這種被稱爲基於內容的推薦(Content-based Recommendation)。

(3) 根據用戶對物品或者信息的偏好,發現物品或者內容本身的相關性,或者是發現用戶的相關性,這種被稱爲基於協同過濾的推薦(Collaborative Filtering-based Recommendation)。

基於人口統計學的推薦

一種最易於實現的推薦方法,簡單的根據系統用戶的基本信息發現用戶的相關程度,然後將相似用戶喜愛的其他物品推薦給當前用戶。

首先,系統對每個用戶都有一個用戶 Profile 的建模,其中包括用戶的基本信息,例如用戶的年齡,性別等等,然後,系統會根據用戶的 Profile 計算用戶的相似度進行推薦。

基於內容的推薦

根據推薦物品或內容的元數據,發現物品或者內容的相關性,然後基於用戶以往的喜好記錄,推薦給用戶相似的物品。

首先我們需要對電影的元數據有一個建模,然後通過電影的元數據發現電影間的相似度,最後實現推薦。需要對物品進行分析和建模,推薦的質量依賴於對物品模型的完整和全面程度。

基於協同過濾的推薦

隨着 Web2.0 的發展,Web 站點更加提倡用戶參與和用戶貢獻,因此基於協同過濾的推薦機制因運而生。它的原理很簡單,就是根據用戶對物品或者信息的偏好,發現物品或者內容本身的相關性,或者是發現用戶的相關性,然後再基於這些關聯性進行推薦。

(1) 基於用戶的協同過濾推薦

根據所有用戶對物品或者信息的偏好,發現與當前用戶口味和偏好相似的“鄰居”用戶羣,在一般的應用中是採用計算“K- 鄰居”的算法;然後,基於這 K 個鄰居的歷史偏好信息,爲當前用戶進行推薦。

在用戶的歷史偏好的數據上計算用戶的相似度,基本假設是,喜歡類似物品的用戶可能有相同或者相似的口味和偏好。

算法流程:


(2) 基於項目的協同過濾推薦

使用所有用戶對物品或者信息的偏好,發現物品和物品之間的相似度,然後根據用戶的歷史偏好信息,將類似的物品推薦給用戶。

喜歡物品 A 的人都喜歡物品 C,基於這個數據可以推斷用戶 C 很有可能也喜歡物品 C,所以系統會將物品 C 推薦給用戶 C。

(3) 基於模型的協同過濾推薦

基於樣本的用戶喜好信息,訓練一個推薦模型,然後根據實時的用戶喜好的信息進行預測,計算推薦。

混合的推薦機制

(1) 加權的混合(Weighted Hybridization):用線性公式(linear formula)將幾種不同的推薦按照一定權重組合起來,具體權重的值需要在測試數據集上反覆實驗,從而達到最好的推薦效果。

(2) 切換的混合(Switching Hybridization):允許在不同的情況下(數據量,系統運行狀況,用戶和物品的數目等),選擇最爲合適的推薦機制計算推薦。

(3) 分區的混合(Mixed Hybridization):採用多種推薦機制,並將不同的推薦結果分不同的區顯示給用戶。

(4) 分層的混合(Meta-Level Hybridization):採用多種推薦機制,並將一個推薦機制的結果作爲另一個的輸入,從而綜合各個推薦機制的優缺點,得到更加準確的推薦。

總結

推薦引擎只是默默的記錄和觀察你的一舉一動,然後再借由所有用戶產生的海量數據分析和發現其中的規律,進而慢慢的瞭解你,你的需求,你的習慣,並默默的無聲息的幫助你快速的解決你的問題,找到你想要的東西。

鏈接:http://www.edu.xxt.cn/articleFront/articleDetailed.action?article.id=2963


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章