在Windows平臺下,先把Heritrix啓動起來
詳細步驟如下:
1、老規矩,開源的東西,先下載,親測地址:http://nchc.dl.sourceforge.net/project/archive-crawler/archive-crawler%20%28heritrix%201.x%29/1.14.4/heritrix-1.14.4.zip
2、將下載的heritrix-1.14.4.zip解壓到本地,如D:/ 目錄下;
3、進入D:/heritrix-1.14.4/conf目錄中,將jmxremote.password.template文件拷貝到 D:/heritrix-1.14.4目錄下,並且修改
該文件名稱爲jmxremote.password
4、打開jmxremote.password文件,翻到最後兩行,將最後兩行中的@PASSWORD@修改爲自己想設置的密碼,如全部修改爲如下格式:
monitorRole admin
controlRole admin
保存該文件;
5、設置jmxremote.password文件的訪問屬性,右擊-屬性(這裏勾上“只讀”)-安全標籤-權限-更改權限-去掉“包括從該對象的父項繼承的權限”,刪除除了當前用戶外的其他用戶;
6、配置heritrix-1.14.4/conf目錄下的heritrix.properties文件中的如下信息:
heritrix.cmdline.admin = admin (等號後面的admin是admin用戶的登錄密碼,與jmxremote.password文件中設置的一致)
heritrix.cmdline.port = 8888 (此處,端口號設置爲不衝突的即可)
heritrix.cmdline.run = false
heritrix.cmdline.nowui = false
heritrix.cmdline.order =
7、重啓電腦(做了上述的配置,總是啓動不起來,後來發現重啓之後就ok了,原因無法解釋)
8、cmd,切換到heritrix的bin目錄下,輸入命令:
heritrix --admin=admin:admin
出現:Heritrix 1.14.4 is running.
Web console is at :http://127.0.0.1:8888
Web console login and password :admin/admin
這樣的字樣的話,說明heritrix啓動成功;
同時,會打開一個管理員:Heritrix的終端窗口,顯示一些版本信息等;
9、在瀏覽器中打開:http://127.0.0.1:8888,輸入登錄名和密碼,登錄成功!
至此,Heritrix就真正地啓動起來了!