Paper Reading@csdl: embedding of Airbnb

paper: <real time personalization using Embeddings for Search Ranking at Airbnb>

目的:推薦house給客戶,要使得客戶喜歡,並且,房東要接受該用戶(時間,偏愛的客戶類型匹配)

細分目的:短期推薦(當客戶點擊了一個listing之後給他推薦相似的listing,最好屬於同一個market),長期推薦(一個用戶一年只用兩三次,很稀疏,且訂的房間屬於不同market,cross market 應該如何推薦)

embedding 思想:一個序列中,相依出現的元素,相似度應該高,embedding的結果應該相似

方法:1、給listing做embedding,給定所有的點擊序列(序列劃分方法:30分鐘內得連續點擊或者booked了算一個序列),word2vec的辦法,來給listing做embedding 特殊技巧:負採樣,booked listing作爲全局context,加入loss,然後,同一個市場(地方)的集合中選一些負樣本,冷啓動問題:根據基本的特徵,選三個去平均來init

2、給user_type和listing_type做embedding,根據基本特徵,分出user_type和listing_type的幾個類別,給這些類別embedding,這個場景下只用booked listing,這樣,就有(user_type,listing_type)序列(只針對一個用戶而言),就可以按照上面的辦法給type embedding,如此一來,客戶的type可能隨時間變化的問題可以解決,對於用戶當前的user_type,選出cosine距離最小的listing_type給他推薦就好了。

技巧:loss裏面加入reject的序列

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章