一年沒有用perl了,發現都快忘光了……
用perl來獲取網頁信息是很簡單的,用LWP module就可以了。
有些時候,比如在公司裏,想要爬網頁需要使用代理,perl裏可以使用LWP::UserAgent來添加代理
use LWP::UserAgent;
my $ua=LWP::UserAgent->new();
$ua->proxy("http","http://xxx.yyy.com");
$ua->env_proxy;
在獲取鏈接內容的時候
my $result=$ua->get($url);
unless($result->is_success){
print LOG ("unable to get ".$url."\n");//輸出到日誌文件
next;
}
my $content=$result->content;//得到網頁內容
多線程我沒有做,也許以後會補上吧