協同過濾算法總結篇

(注:這裏不再對算法公式累述)
1.相似度算法

1.1Jaccard距離
使用集合中的不同元素的比例來衡量兩個集合的區分度,但是存在比較明顯的問題無法關注到集合中元素的權重值(評分)

1.2餘弦相似度
利用向量空間解決了權重值(評分)帶入相似度計算的問題,非常常用的相似度算法,彌補了Jaccard距離計算的不足

1.3Pearson相似度(又名中心餘弦相似度)
Pearson相似度是對餘弦相似度改進,簡明來說就是將權重值(評分)減去權重的平均值,可以理解爲將權重值相對於整體佔比帶入到特徵中,均值中心化處理對算法的準確性有一定的提高

2.奇異值分解(SVD)降維
當數據量過多的時候,相似度計算的負荷顯著增大,這時候使用SVD進行降維可以有效的減輕計算負擔

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章