java是由Jsoup实现网络爬虫(爬取豆瓣书评top25)的书籍数据

这是主要对Jsoup 的方法熟悉,Jsoup 学习推荐
下面就是爬取数据的有关代码:

String link = null;   // 书的链接
        String title = null;  // 书的名称
        String score = null;  // 书的评分
        String num = null ;   // 获取评价人数
        Document content = Jsoup.connect("https://book.douban.com/top250").get();
        //Elements pl2 = content.getElementsByClass("item");
        Elements pl2 = content.select(".item");
        int i=1;
        for (Element element:pl2){
            Element links = element.getElementsByTag("a").first();
            Element putureUrl = element.getElementsByTag("img").get(0);
            Element star = element.getElementsByClass("star clearfix").get(0);
            Element pl21 = element.getElementsByClass("pl2").get(0);
            Element controller = element.getElementsByClass("quote").get(0);
            link = links.attr("href");        // 获取电影的链接
            String url = putureUrl.attr("src");
            title = pl21.child(0).html();    // 获取电影名称
            String content1 = controller.child(0).html();  //简介
            score = star.child(1).html();     // 获取电影评分
            num = star.child(2).html();       // 获取评价人数
            System.out.println(i+++"\t"+link +"\t图片地址:"+ url+"\t" + title + "\t评分" + score + "\t" + num+"\t"+content1);

        }

运行的结果如下:`
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章