httrack命令行使用方法

轉載請註明出處:http://www.myzhenai.com/thread-15442-1-1.html http://www.myzhenai.com.cn/post/948.html


httrack:http://www.httrack.com/ 是一款網站鏡像程序,就是可以把網站結構下載到本地的程序,某些人也可以稱爲網站扒皮工具或網站複製工具.

使用者可以通過HTTrack把互聯網上的網站頁面下載到本地計算機上。在默認設置下,HTTrack對網站頁面的下載結果是按照原始站點相對鏈接的結構來組織的。

HTTrack使用網絡爬蟲下載網站。對於有robots.txt的網站,如果不在程序運行時取消限制,默認設置下的程序不會把網站完全鏡像。HTTrack能跟隨基本的JavaScript,或者Applet、Flash中的鏈接,但是對於複雜的鏈接(使用函數和表達式創建的鏈接)或者服務器端的Image Map(Image Map)則無能爲力。


命令行下運行httrack的方法

#httrack

Welcome to HTTrack Website Copier (Offline Browser) 3.46+libhtsjava.so.2
Copyright (C) Xavier Roche and other contributors
To see the option list, enter a blank line or try httrack –help

Enter project name :
//輸入項目名稱,程序會自動生成一個項目名稱的目錄


Base path (return=/root/websites/) :
//本地保存路徑及目錄,請輸入一個本地的路徑.


Enter URLs (separated by commas or blank spaces) :
//欲抓取的網站地址,這裏我們以 https://www.dnspod.cn/ 演示


Action:
(enter) 1 Mirror Web Site(s)
2 Mirror Web Site(s) with Wizard
3 Just Get Files Indicated
4 Mirror ALL links in URLs (Multiple Mirror)
5 Test Links In URLs (Bookmark Test)
0 Quit
:
//抓取模式選項,選項漢化過來的意思是
行動:
(進入)1鏡像網站(的)
2鏡像網站(S)與嚮導
3只獲得文件中聲明的文件
4鏡在URL中所有的鏈接(多鏡)
5在URL鏈接(書籤測試)的測試
0退出
//這裏我選擇2


Proxy (return=none) :
//是否使用代理,我沒有用代理,直接回車.


You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip
Wildcards (return=none) :

//使用通配符下載,我直接回車


You can define additional options, such as recurse level (-r), separed by blank spaces
To see the option list, type help
Additional options (return=none) :

//抓取選項,輸入help可以查閱詳細參數,這裏我直接回車

—> Wizard command line: httrack https://www.dnspod.cn/ -W -O “/home/RucLinux/DNSPod” -%v

Ready to launch the mirror? (Y/n) :
//輸入 Y 回車

WARNING! You are running this program as root!
It might be a good idea to use the -%U option to change the userid:
Example: -%U smith

Mirror launched on Mon, 04 Mar 2013 02:35:02 by HTTrack Website Copier/3.46+libhtsjava.so.2 [XR&CO’2010]
mirroring https://www.dnspod.cn/ with the wizard help..
Done.
Thanks for using HTTrack!
*
//操作完畢


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章