Mahout 常用相似度度量(筆記)

Mahout 基於推薦系統,分類,聚類算法 等經常用到的相似度度量:


PearsonCorrelationSimilarity 皮爾森距離


EuclideanDistanceSimilarity 歐幾里德距離


CosineMeasureSimilarity   餘弦距離(0.7變成了UncenteredCosineSimilarity


SpearmanCorrelationSimilarity 斯皮爾曼等級相關, 排序後的皮爾森距離


TanimotoCoefficientSimilarity 谷本相關係數, 基於boolean preference


LogLikelihoodSimilarity  最大似然估計 最大似然估計,也稱爲最大概似估計,是一種統計方法,它用來求一個樣本集的相關概率密度函數的參數。 一般好於TanimotoCoefficientSimilarity 


CityBlockSimilarity  基於曼哈頓距離


參考鏈接:mahout 推薦算法基礎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章