重拾perl,寫了個小爬蟲

一年沒有用perl了,發現都快忘光了……


用perl來獲取網頁信息是很簡單的,用LWP module就可以了。

有些時候,比如在公司裏,想要爬網頁需要使用代理,perl裏可以使用LWP::UserAgent來添加代理

use LWP::UserAgent;
my $ua=LWP::UserAgent->new();
$ua->proxy("http","http://xxx.yyy.com");
$ua->env_proxy;

在獲取鏈接內容的時候

my $result=$ua->get($url);
	unless($result->is_success){
		print LOG ("unable to get ".$url."\n");//輸出到日誌文件
		next;
	}
	my $content=$result->content;//得到網頁內容

多線程我沒有做,也許以後會補上吧
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章