論文筆記：Collaborative Filtering for Implicit Feedback Datasets

一、基本信息

論文題目：《Collaborative Filtering for Implicit Feedback Datasets》

發表時間：ICDM 2008

作者及單位：

論文地址：https://dl.acm.org/citation.cfm?id=1510528.1511352

二、摘要

推薦系統的一個共同任務是通過基於事先隱含反饋的個性化推薦來改善客戶體驗。這些系統被動地跟蹤不同類型的用戶行爲，例如購買歷史記錄、觀看習慣和瀏覽活動，以模擬用戶偏好。與被更廣泛研究的明確反饋不同，我們沒有用戶關於他們偏好的任何直接輸入。特別是，我們缺乏消費者不喜歡哪些產品的充分證據。在這項工作中，我們確定了隱式反饋數據集的獨特的適當聯繫。我們建議將這些數據視爲積極和消極偏好的跡象，這些偏好與顯著變化的信心水平有關。這導致了一個因素模型，特別是針對隱含反饋推薦。我們還建議一個可擴展的優化過程，它與數據大小成線性關係。該算法在電視節目推薦系統中得到了成功應用。它與其他已知方法的調優實現相比更爲有利。此外，我們還提供了一種新的方法來解釋這個因素模型給出的建議。

三、主要內容與工作

1、使用隱式反饋的幾個特點：

No negative feedback
Implicit feedback is inherently noisy
The numerical value of explicit feedback indicates preference, whereas the numerical value of implicit feedback indicates confidence.
Evaluation of implicit-feedback recommender requires appropriate measures.

2、

四、總結

在這項工作中，我們研究了隱式反饋的數據集協同過濾，這是一種非常常見的情況。我們的一個主要結論是，隱式用戶觀察應該轉化爲兩個成對的量級：偏好和信心水平。換言之，對於每個用戶項對，我們從輸入數據中得出一個估計值，以判斷用戶是否喜歡該項（“首選項”），並將該估計值與置信水平結合起來。在廣泛研究的顯式反饋數據集中，這種偏好一致性劃分沒有平行性，但在分析隱式反饋中起着關鍵作用。
我們提供了一種潛在因素算法，可以直接對偏好信心範式進行廣告設計。與顯式數據集不同，這裏的模型應該將所有用戶項首選項作爲輸入，包括那些與任何輸入觀察無關的參數（因此暗示爲零首選項）。這一點至關重要，因爲給定的觀察結果固有地偏向於積極的偏好，因此不能很好地反映用戶的偏好。但是，將所有用戶項值作爲模型的輸入會引發嚴重的可伸縮性問題——所有這些對的數量往往明顯超過輸入大小，因爲典型的用戶只會對可用項的一小部分提供反饋。我們通過利用模型的代數結構來解決這一問題，從而得到一種算法，該算法在不使用任何子採樣的情況下，在處理整個用戶項對範圍的同時，與輸入大小成線性比例。

該算法的一個有趣特點是，它允許向最終用戶解釋建議，這在潛在因素模型中是罕見的。這是通過在衆所周知的面向項目的鄰近方法中顯示出一種令人驚訝的、希望富有洞察力的聯繫來實現的。
該算法作爲大型電視推薦系統的一部分進行了實現和測試。我們的設計方法力求在隱式反饋數據集的獨特屬性和計算可伸縮性之間找到一個正確的平衡。我們目前正在探索一種以增加計算複雜性爲代價提高精度的可能性。作爲一個例子，在我們的模型中，我們決定用相同的一致置信度來處理與零偏好相關的所有用戶項對。由於絕大多數對都與零偏好相關，因此該決策節省了大量計算工作。然而，一個更仔細的分析會將這些零值分爲不同的置信度級別，可能基於項目的可用性。在我們的電視推薦示例中，用戶沒有觀看節目的事實可能意味着用戶不知道該節目（該節目位於“不尋常”頻道或一天中的某個時間），或者同時有另一個最喜歡的節目，或者用戶只是不感興趣。每一個都對應不同的場景，並且每一個都可能保證在“無偏好”假設中有一個獨特的信心水平。這導致我們對該模型進行了另一種可能的擴展——添加一個動態時間變量，以解決用戶在特定時間觀看電視的趨勢。同樣地，我們想模擬一些程序類型在一天中的不同時間更受歡迎。這是一項正在進行的研究的一部分，其中主要的挑戰似乎是如何在保持良好的計算可伸縮性的同時，將額外的靈活性引入到模型中。

最後，我們注意到，標準的訓練和測試設置旨在評估模型對未來用戶行爲的預測能力。然而，這並不是推薦系統的目的，推薦系統試圖將用戶指向他們可能沒有購買或消費的商品。在不使用深入的用戶研究和調查的情況下，很難看到如何評估該目標。在我們的示例中，我們相信通過評估我們的方法，通過刪除重新觀看的節目的“簡單”案例，我們以某種方式接近嘗試捕獲用戶發現新節目的理想。

論文筆記：Collaborative Filtering for Implicit Feedback Datasets

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

論文筆記：Offline Time-Stamping Using TPM and Its Java Library

C++筆記：C++標準庫中各種數據結構的用法（棧、向量、字典、集合）

論文筆記：Augmented Variational Autoencoders for Collaborative Filtering with Auxiliary Information

論文筆記：Collaborative Filtering for Implicit Feedback Datasets

論文筆記：Social Collaborative Filtering Ensemble

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結