搜索引擎反作弊

作弊的本質是:在網頁排名信號中,加入噪音,反作弊的關鍵是,去除噪音。

 

早期作弊方法:重複關鍵詞,賣鏈接。

 

針對商業相關的搜索,採用一套 抗干擾 強的搜索算法。

出鏈向量間餘弦距離幾乎爲1(賣鏈接)。

作弊網站需要相互鏈接,形成一個Clique,互聯網大圖中有一些Clique,用圖論知識解決。

 

具體:http://blog.csdn.net/malefactor/article/details/7389311

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章