推薦系統基礎之一-簡介

1.什麼是推薦系統

根據用戶的信息需求、興趣等,將用戶感興趣的信息、產品等推薦給用戶的個性化信息推薦de系統。
和搜索引擎相比,推薦系統通過研究用戶的興趣偏好,進行個性化計算,由系統發現用戶的興趣點,從而引導用戶發現自己的信息需求。

2.爲什麼需要推薦系統

爲了解決用戶在無明確需求場景下信息過載問題的,目的是將長尾內容暴露到可能感興趣的人面前。

3.怎樣評判推薦內容好壞

參考項亮的<<推薦系統實踐>>

3.1用戶滿意度

基本在實際操作中不可用,首先這是一個相對主觀的指標,一般依靠用戶調研獲取,而用戶基本也不知道自己想要什麼,最多談一個表面上的感受,參考價值不大。其次最關心推薦系統好壞的往往是這個項目的PM,用戶滿意度的概念很容易被偷換成PM滿意度或老闆滿意度。所以在實際情況下,會用衡量準確度的客觀指標來參考,比如通過點擊率的統計看用戶對推出內容的滿意程度。

3.2預測準確度

評分預測:根據用戶對物品歷史評分,獲得用戶的興趣模型,從模型中分析用戶對另一物品的評分。
準確度通過 均方根誤差(RMSE)和平均絕對誤差(MAE)計算。

TopN推薦:給用戶一個個性化推薦列表,通過準確率/召回率度量

3.3覆蓋率(coverage)

覆蓋率:推薦系統挖掘長尾信息的能力。
推薦的物品佔總物品集合的比例。統計推薦列表物品出現次數的分佈,若分佈較平,說明覆蓋率較高;
經濟學中的兩個指標定義:信息熵、基尼係數

馬太效應:強者更強,弱者更弱。
設G1爲初始用戶行爲中計算的物品流行度基尼係數;
設G2爲推薦計算的物品流行度基尼係數;
若G2>G1,說明推薦算法具有馬太效應。

3.4多樣性

衡量推薦系統好壞另一個最重要指標,也是推薦系統到最後最容易出現的問題—過度收斂。

3.5新穎性

推出那些用戶之前沒有接觸過的內容。

3.6驚喜度

旨在推出和之前內容沒有任何關係但用戶又很滿意的內容,這也是一個很主觀的指標,較難衡量。

還有一些跟場景比較相關的指標這裏就不贅述了,比如信任度,實時性,健壯性。在不同的應用場合比如社交可能更關心信任度,新聞更關心實時性,反作弊更關心健壯性。

最後以上指標並不是都越高越好,幾項指標都有內在聯繫。比如多樣性和新穎性高了準確度就會下降,所以幾項指標的最優搭配,纔是衡量一個好推薦系統的標準。 不同標準在不同的應用場合也有所不同。

3.7評測維度分類

用戶
物品
時間

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章