Youtube-利用用戶的評分行爲的推薦(有別於經典的協同過濾算法)

Youtube-利用用戶的評分行爲的推薦(有別於經典的協同過濾算法)

 

背景:

Youtube的一些背景

(1)2012時候:485000000個視頻,大數據

(2)每分鐘上傳48小時的視頻

(3)每天上傳8年的內容

總而言之大用戶量,大視頻量。

推薦所用的數據:用戶顯示顯示錶達爲喜歡的video

問題:

(1)如果採用傳統的協同過濾,U×I矩陣可能很稀疏,用戶共同評分的video數目有限,推薦效果不準確,因此,協同過濾算法不適用

(2)用戶的基於內容的推薦也有問題:用戶評價過的視頻有限,每個視頻的元數據可能有限,可能有誤,如果僅以此作爲推薦,效果可能很差。

(3)基於朋友的推薦:缺點,朋友之間的品位可能不同,而且朋友數目也不是很多。

(3)專門提出一種針對youtube的算法:推薦的video,看的人多,優評的人也多

算法描述:

用戶可用信息有限,重新定義新的用戶相似性來尋找用戶組相似的用戶組。因此相似用戶的選取成爲一個關鍵的因素:

相似用戶的定義:把用戶u喜歡的video的上傳者作爲相似用戶,把這些用戶的新歡的其他作爲推薦的candidate。(注意這裏只把相似用戶喜歡的同類型的video作爲推薦的candidate,因爲我們無法做出這樣的推斷,u和related user都新歡經典音樂,related user還喜歡爵士樂,則都喜歡爵士樂)。

第1步:

找到每個用戶顯示錶示喜歡的視頻的上傳者,這些視頻的所屬類型。這些用戶作爲related users,記錄related user 和category

第2步:

找到第一步中所related user所喜歡的和目標用戶相同類型的video。這些視頻當成是用戶感興趣的video。(顯然related user如果是active user的話效果會更好,顯然視頻上傳者,可以視爲active user)

第三步:

對第二部中的video進行排序:排序的影響因素

1、視頻的觀看次數viewCount,

2、積極評價的次數likeCount,

3、消極評價的次數dislikeCount。

That informationrepresents, in a way, the recommendation of the whole YouTube community.(基於社交的推薦),另外兩個因素也考慮在這裏面。

4、appearanceNumber和

5、userFactor.

最終的ranking公式如(1)所示

如下圖的userX 的videoX作爲推薦的candidate



ViewCount取對數是爲了,和其他的因子儘量在同一個量級的範圍左右。

DislikeCount越高懲罰的因子越高。取根號是經驗值,這樣的效果會更好。The overallassessment of a video we decided to punish according to the proportion of negativeevaluations of the video. We found empirically that itis desirable for better results to attenuate the impact of that portion andtherefore we decided to take the square root. If that is not done then videoswith very few views and even fewer ratings, all of which arepositive, are ranked very high.

appearanceNumber是在推薦類表中被幾個relateduser表示爲positive的次數,比如2,等.

userFactor用戶對該視頻所屬類的所有視頻喜歡的次數,因爲重要性不如appearanceNumber,所以開根號降低權限。

如果dislikeCount爲0,則設置爲1

If a video is really good and has alarge number of positive ratings and a large number of views then adding a onedislike to such video will not have a major impact on its overall rating.

If a video has a small number of positive ratings and a small number of viewsthis will greatly reduce its rating, but this effect is positive because weusually don't want to recommend such a video (obviously this video isinteresting to a small group of people, andtherefore it is not likely that it will be interesting to user U).—>總結爲:看的人多且優評的人。我們要的是這樣的視頻

聲明:上述內容來自

 Brbić, Maria, Eugen Rožić, and Ivana Podnar Žarko. "Recommendation of YouTube Videos." 35th International Convention on Information and Communication Technology, Electronics and Microelectronics. 2012.

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章