簡易網絡爬蟲

queue隊列(存放URL):先進先出




簡易網絡爬蟲所用到的類:


queue.java--存放未抓取的URL信息


LinkDB.java--存放已抓取和未抓取的URL信息


FileDownloader.java--網頁下載器


ExtractLink.java--抽取網頁當中所有URL


LinkFilter.java--實現URL過濾操作


Crawler.java--網絡爬蟲
入口類
發佈了57 篇原創文章 · 獲贊 1 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章