新聞網頁排序與普通網頁排序有幾個顯著的區別。首先是時效性,新聞網頁一般都有發佈時間,這是新聞的重要特徵,所以排序時必須考慮到,另外就是新聞網頁的鏈接較少,類似PageRank的鏈接分析在這裏很難用上。
對新聞網頁排序可能考慮的幾個因素:時間(Time);發佈新聞的網站(Source);該新聞的流行程度(Popularity),這主要可以通過聚類分法找到同類新聞的數量.當然肯定還有其他的因素可以考慮。
新聞網頁排序與普通網頁排序有幾個顯著的區別。首先是時效性,新聞網頁一般都有發佈時間,這是新聞的重要特徵,所以排序時必須考慮到,另外就是新聞網頁的鏈接較少,類似PageRank的鏈接分析在這裏很難用上。
對新聞網頁排序可能考慮的幾個因素:時間(Time);發佈新聞的網站(Source);該新聞的流行程度(Popularity),這主要可以通過聚類分法找到同類新聞的數量.當然肯定還有其他的因素可以考慮。
[數據挖掘]聚類算法一覽 聚類分析是數據挖掘中的一個很活躍的研究領域,並提出了許多聚類算法。這些算法可以被分爲劃分方法、層次方法、基於密度方法、基於