新闻网页排序与普通网页排序有几个显著的区别。首先是时效性,新闻网页一般都有发布时间,这是新闻的重要特征,所以排序时必须考虑到,另外就是新闻网页的链接较少,类似PageRank的链接分析在这里很难用上。
对新闻网页排序可能考虑的几个因素:时间(Time);发布新闻的网站(Source);该新闻的流行程度(Popularity),这主要可以通过聚类分法找到同类新闻的数量.当然肯定还有其他的因素可以考虑。
新闻网页排序与普通网页排序有几个显著的区别。首先是时效性,新闻网页一般都有发布时间,这是新闻的重要特征,所以排序时必须考虑到,另外就是新闻网页的链接较少,类似PageRank的链接分析在这里很难用上。
对新闻网页排序可能考虑的几个因素:时间(Time);发布新闻的网站(Source);该新闻的流行程度(Popularity),这主要可以通过聚类分法找到同类新闻的数量.当然肯定还有其他的因素可以考虑。
[數據挖掘]聚類算法一覽 聚類分析是數據挖掘中的一個很活躍的研究領域,並提出了許多聚類算法。這些算法可以被分爲劃分方法、層次方法、基於密度方法、基於