Mahout 基於推薦系統,分類,聚類算法 等經常用到的相似度度量:
PearsonCorrelationSimilarity 皮爾森距離
EuclideanDistanceSimilarity 歐幾里德距離
CosineMeasureSimilarity 餘弦距離(0.7變成了UncenteredCosineSimilarity)
SpearmanCorrelationSimilarity 斯皮爾曼等級相關, 排序後的皮爾森距離
TanimotoCoefficientSimilarity 谷本相關係數, 基於boolean preference
LogLikelihoodSimilarity 最大似然估計 最大似然估計,也稱爲最大概似估計,是一種統計方法,它用來求一個樣本集的相關概率密度函數的參數。 一般好於TanimotoCoefficientSimilarity
CityBlockSimilarity 基於曼哈頓距離
參考鏈接:mahout 推薦算法基礎