RecSys’16 Workshop on Deep Learning for Recommender Systems (DLRS)

cited

Karatzoglou A, Hidasi B, Tikk D, et al. RecSys’ 16 Workshop on Deep Learning for Recommender Systems (DLRS)[C]//Proceedings of the 10th ACM Conference on Recommender Systems. ACM, 2016: 415-416.

ABSTRACT

我們認爲深度學習是推薦系統技術的下一個重要課題之一。 近幾年來,深度學習已經在計算機視覺,自然語言處理和語音識別等複雜任務中取得了巨大的成功。 儘管如此,一些用於推薦系統的深度學習方法的工作已經出現了。 最近的應用領域是音樂推薦,新聞推薦和基於會話的推薦。 研討會的目的是鼓勵在推薦系統中應用深度學習技術,促進用於推薦系統的深度學習方法的研究,並彙集推薦系統和深度學習社區的研究人員。

1. INTRODUCTION

近幾年來,深層神經網絡在計算機視覺,自然語言處理和語音識別等複雜任務中取得了巨大的成功。 因此,它是機器學習社區最熱門的話題之一。 深度學習是一類算法,其中數據通過在複雜架構中組織的非線性層層層傳遞,其中每層都學習數據的潛在表示。

儘管在推薦任務中採用了相對有限的技術,但我們認爲,由於以下幾個原因,深度學習是推薦系統技術中的下一個大課題之一:

(1)深度學習能夠捕獲其他算法在大規模數據集中無法獲取的複雜依賴和非線性關係,從而可以在算法層中的對用戶偏好進行新的更深入的建模和編碼,這種建模無需瞭解有助於預測的模式的確切性質。

(2)深度學習技術可以通過提取高質量的特徵表示的能力來整合附加的數據源(內容本身,文本,圖像,音樂,視頻等)從而豐富推薦算法的偏好模型。以前的推薦系統已經集中在利用內容的轉換和/或描述(即元數據)上。 然而,產品的視覺信息(即,產品的圖像)對於用戶的決定(例如,如果它們是否點擊推薦的商品)有着很大的影響。 深度學習方法允許對項目的內容特徵進行更好和更準確的建模,特別是諸如圖像的視覺特徵,商品描述的文本特徵和歌曲的音頻信號特徵。

(3)深度學習有着允許對用戶偏好進行直接建模的潛在能力,可以想象,通過足夠的用戶偏好數據,可以基於項目的內容特徵來導出產品偏好的用戶模型。 例如,可以通過訓練好的卷積圖像分類模型以識別用戶將喜歡的項目。 比如一雙特定的鞋子或運動服裝,甚至是潛在的合作伙伴(相互推薦)。 這將不再使用協同過濾的用戶偏好模型,從而允許在單個服務器上收集和建模大量偏好數據。

(4)最後,深度學習方法爲關鍵的推薦問題提供了豐富的工具包,例如使用RNN的基於session的推薦。 推薦系統中使用的機器學習方法相對受限於一小組方法,例如矩陣分解,LDA。深度學習方法可以並已經用於協同過濾模型,例如 去噪自動編碼器,受限玻爾茨曼機等。我們期望看到更多關於如何在協同過濾中使用深度學習方法的研究,其中包含考慮內容和上下文的模型。 深度學習方法有可能擴展這些方法,並增強現有的方法。

DLRS 2016的目標是通過彙集推薦系統和深度學習的研究人員,幫助引入和加速RecSys中深度學習的使用。

2. DEEP LEARNING IN RECSYS

大多數關於深層模型和推薦結合的工作都集中在傳統的協同過濾(CF)用戶-項目環境上。受限玻爾茲曼機器(RBM)是用於經典CF和推薦系統的第一個神經網絡。 最近,去噪自動編碼器已經被用於以類似的方式執行CF 。深層網絡也被用於跨域推薦,其中使用深層神經網絡將item被映射到的聯合潛在空間。

在推薦中自動生成的內容特徵是深度學習最激動人心的研究路徑之一。先前的工作通常將這些特徵與更傳統的協同過濾模型一起使用。卷積深度網絡已被用於從音樂文件中提取特徵,然後在因子模型中使用。最近出現了一種更通用的方法,通過使用深層網絡從項目中提取一般內容特徵,然後將這些特徵併入標準CF模型中以增強推薦性能。這種方法似乎在沒有足夠的用戶-項目交互信息的環境下特別有用。使用卷積網絡提取的圖像特徵已被用於中的經典矩陣分解型CF,以提高推薦的質量。深度學習也可以解決新的推薦問題。例如使用定製的循環神經網絡來對click-session數據進行建模,以提供基於session的建議。

3. THE POTENTIAL OF DEEP LEARNING

我們提出了四個研究課題,在顯著提高推薦算法方面有着巨大的潛在能力:

Content modeling: 將非結構化數據源(例如文本,音頻,視頻或圖像)合併到推薦算法中是在推薦系統中應用深度學習的更簡單的方法之一。 正如我們之前所提到的,包含的內容比元數據更有意義,並且有望提供更好的推薦。 真正的基於內容的方法可以幫助推薦中長期存在的問題,如項目冷啓動,同時推薦相關內容。

User and session modeling: 傳統的協同過濾主要集中在創建靜態用戶模型,這些模型對於變化緩慢的場景以及項目相關性是基於偏好的而不是基於必需性的(例如,與家用電器相反的電影)是有利的。 一些領域和場景需要更多的動態行爲建模。在其他方面,重要的是找出使用長期和短期用戶歷史的平衡。 建模意圖對於瞭解用戶真正想要的內容也很重要。 最後,在永久性用戶冷啓動問題的情況下,使用會話而不是用戶歷史很重要。 所有上述問題都可以通過適當使用深度學習的序列建模(例如循環神經網絡)來解決。

Situation modeling: 圍繞着越來越多的傳感器,推薦系統可以獲得更多有關我們所處的情況的數據,並據此推薦。 基於場景的(或上下文驅動)推薦將是未來幾年的主要變化之一。 從大量的傳感器數據中瞭解情況需要強大的模式識別方法,如深層神經網絡。

Adapting deep learning: 即使深層神經網絡具有很大的潛力,它們在推薦系統領域的應用也應該小心。 在開發新方法時必須考慮到訓練時間,響應時間和可擴展性。因此,神經模型應適應推薦任務。

4. SUMMARY

深入學習在很多對計算機很難的任務上取得了巨大的成功。我們相信現在是應用它們在RecSys領域的時候了。 深度學習有潛力成爲下一代推薦系統的核心。 DLRS 2016旨在加速RecSys社區中這些方法的傳播和接受。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章