一、需求文件
heritrix-1.41.3-src.zip
heritrix-1.14.3.zip
在http://sourceforge.net/project/showfiles.php?group_id=73833&package_id=73980可以下載
二、準備
把下載的兩個文件分別解壓到不同的目錄中
三、在eclipse中新建一個java appliction
分別把heritrix-1.14.3.zip的解壓文件中的conf,webapps,lib文件夾拷到工程中
如圖所示heritrix-1.jpg
把heritrix-1.14.3-src.zip的解壓目錄下的java目錄中的META-INF,org,st目錄拷貝到工程目錄的src目錄下,把heritrix-1.14.3.zip的解壓文件中的profiles,mudules,selftest目錄拷貝到src目錄下
配置後如圖heritrix-2.jpg
在conf/heritrix.properties中配置用戶名密碼
如圖heritrix-3.jpg
四、工程基本搭建完成,把工程下的lib中的jar文件配置到工程中(Build Path)
五、運行org.archive.crawler.Heritrix類,工程啓動
六、訪問http://localhost:8080/