在Windows平台下,先把Heritrix启动起来
详细步骤如下:
1、老规矩,开源的东西,先下载,亲测地址:http://nchc.dl.sourceforge.net/project/archive-crawler/archive-crawler%20%28heritrix%201.x%29/1.14.4/heritrix-1.14.4.zip
2、将下载的heritrix-1.14.4.zip解压到本地,如D:/ 目录下;
3、进入D:/heritrix-1.14.4/conf目录中,将jmxremote.password.template文件拷贝到 D:/heritrix-1.14.4目录下,并且修改
该文件名称为jmxremote.password
4、打开jmxremote.password文件,翻到最后两行,将最后两行中的@PASSWORD@修改为自己想设置的密码,如全部修改为如下格式:
monitorRole admin
controlRole admin
保存该文件;
5、设置jmxremote.password文件的访问属性,右击-属性(这里勾上“只读”)-安全标签-权限-更改权限-去掉“包括从该对象的父项继承的权限”,删除除了当前用户外的其他用户;
6、配置heritrix-1.14.4/conf目录下的heritrix.properties文件中的如下信息:
heritrix.cmdline.admin = admin (等号后面的admin是admin用户的登录密码,与jmxremote.password文件中设置的一致)
heritrix.cmdline.port = 8888 (此处,端口号设置为不冲突的即可)
heritrix.cmdline.run = false
heritrix.cmdline.nowui = false
heritrix.cmdline.order =
7、重启电脑(做了上述的配置,总是启动不起来,后来发现重启之后就ok了,原因无法解释)
8、cmd,切换到heritrix的bin目录下,输入命令:
heritrix --admin=admin:admin
出现:Heritrix 1.14.4 is running.
Web console is at :http://127.0.0.1:8888
Web console login and password :admin/admin
这样的字样的话,说明heritrix启动成功;
同时,会打开一个管理员:Heritrix的终端窗口,显示一些版本信息等;
9、在浏览器中打开:http://127.0.0.1:8888,输入登录名和密码,登录成功!
至此,Heritrix就真正地启动起来了!