这是主要对Jsoup 的方法熟悉,Jsoup 学习推荐
下面就是爬取数据的有关代码:
String link = null; // 书的链接
String title = null; // 书的名称
String score = null; // 书的评分
String num = null ; // 获取评价人数
Document content = Jsoup.connect("https://book.douban.com/top250").get();
//Elements pl2 = content.getElementsByClass("item");
Elements pl2 = content.select(".item");
int i=1;
for (Element element:pl2){
Element links = element.getElementsByTag("a").first();
Element putureUrl = element.getElementsByTag("img").get(0);
Element star = element.getElementsByClass("star clearfix").get(0);
Element pl21 = element.getElementsByClass("pl2").get(0);
Element controller = element.getElementsByClass("quote").get(0);
link = links.attr("href"); // 获取电影的链接
String url = putureUrl.attr("src");
title = pl21.child(0).html(); // 获取电影名称
String content1 = controller.child(0).html(); //简介
score = star.child(1).html(); // 获取电影评分
num = star.child(2).html(); // 获取评价人数
System.out.println(i+++"\t"+link +"\t图片地址:"+ url+"\t" + title + "\t评分" + score + "\t" + num+"\t"+content1);
}
运行的结果如下:`