背景
由于工作原因,有幸接触并使用了mahout,mahout是一个apache开源的项目,直译为驯象人,实际上是一个数据挖掘的框架,可以和hadoop,spark,storm等结合使用,用于处理大数据。mahout比较吸引人的地方是,有很多数据挖掘需要的算法,mahout已经写成包,如果没有特殊需求,不懂java的人也可以直接拿来使用,例如协同过滤、聚类算法等。
由于工作原因,有幸接触并使用了mahout,mahout是一个apache开源的项目,直译为驯象人,实际上是一个数据挖掘的框架,可以和hadoop,spark,storm等结合使用,用于处理大数据。mahout比较吸引人的地方是,有很多数据挖掘需要的算法,mahout已经写成包,如果没有特殊需求,不懂java的人也可以直接拿来使用,例如协同过滤、聚类算法等。
package test.mahout.recommendation; import java.io.File; import java.io.IO