1.什麼是推薦系統
根據用戶的信息需求、興趣等,將用戶感興趣的信息、產品等推薦給用戶的個性化信息推薦de系統。
和搜索引擎相比,推薦系統通過研究用戶的興趣偏好,進行個性化計算,由系統發現用戶的興趣點,從而引導用戶發現自己的信息需求。
2.爲什麼需要推薦系統
爲了解決用戶在無明確需求場景下信息過載問題的,目的是將長尾內容暴露到可能感興趣的人面前。
3.怎樣評判推薦內容好壞
參考項亮的<<推薦系統實踐>>
3.1用戶滿意度
基本在實際操作中不可用,首先這是一個相對主觀的指標,一般依靠用戶調研獲取,而用戶基本也不知道自己想要什麼,最多談一個表面上的感受,參考價值不大。其次最關心推薦系統好壞的往往是這個項目的PM,用戶滿意度的概念很容易被偷換成PM滿意度或老闆滿意度。所以在實際情況下,會用衡量準確度的客觀指標來參考,比如通過點擊率的統計看用戶對推出內容的滿意程度。
3.2預測準確度
評分預測:根據用戶對物品歷史評分,獲得用戶的興趣模型,從模型中分析用戶對另一物品的評分。
準確度通過 均方根誤差(RMSE)和平均絕對誤差(MAE)計算。
TopN推薦:給用戶一個個性化推薦列表,通過準確率/召回率度量
3.3覆蓋率(coverage)
覆蓋率:推薦系統挖掘長尾信息的能力。
推薦的物品佔總物品集合的比例。統計推薦列表物品出現次數的分佈,若分佈較平,說明覆蓋率較高;
經濟學中的兩個指標定義:信息熵、基尼係數
馬太效應:強者更強,弱者更弱。
設G1爲初始用戶行爲中計算的物品流行度基尼係數;
設G2爲推薦計算的物品流行度基尼係數;
若G2>G1,說明推薦算法具有馬太效應。
3.4多樣性
衡量推薦系統好壞另一個最重要指標,也是推薦系統到最後最容易出現的問題—過度收斂。
3.5新穎性
推出那些用戶之前沒有接觸過的內容。
3.6驚喜度
旨在推出和之前內容沒有任何關係但用戶又很滿意的內容,這也是一個很主觀的指標,較難衡量。
還有一些跟場景比較相關的指標這裏就不贅述了,比如信任度,實時性,健壯性。在不同的應用場合比如社交可能更關心信任度,新聞更關心實時性,反作弊更關心健壯性。
最後以上指標並不是都越高越好,幾項指標都有內在聯繫。比如多樣性和新穎性高了準確度就會下降,所以幾項指標的最優搭配,纔是衡量一個好推薦系統的標準。 不同標準在不同的應用場合也有所不同。
3.7評測維度分類
用戶
物品
時間