1.使用java簡單爬取CSDN

最近在看爬蟲相關的知識，其實還是那句話，萬變不離其宗。得到網頁，然後解析就可以得到我們想要的內容了，但是現在很少用java寫爬蟲的吧，所以寫了一個java爬蟲玩一下。

目標網站: CSDN首頁
然後java爬蟲需要httpcilent請求，jsoup解析，相應的jar包鏈接如下，下載就好。
鏈接
提取碼：63kv

然後就是代碼：

package com.company;

import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.config.CookieSpecs;
import org.apache.http.client.config.RequestConfig;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.HttpClientBuilder;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 * @author shelgi
 */
public class Main {

    public static void main(String[] args) throws Exception{
	// write your code here
        HttpClient client = HttpClientBuilder.create().build();
        HttpGet hget=new HttpGet("https://www.csdn.net/");
        RequestConfig defaultConfig = RequestConfig.custom().setCookieSpec(CookieSpecs.STANDARD).build(); hget.setConfig(defaultConfig);
        hget.setHeader("user-agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36");
        HttpResponse response=client.execute(hget);
        String content= EntityUtils.toString(response.getEntity(),"utf-8");
        //jsoup解析網頁
        Document doc = Jsoup.parse(content);
        String title=doc.title();
        System.out.println("標題爲:"+title);
        Elements links=doc.select("#feedlist_id > li> div > div.title > h2 > a");
        System.out.println(links);
        for(Element link:links){
            System.out.println(link.text()+":"+link.attr("href"));
        }
    }
}

運行效果

2.python的字符動態輸出

經常看那些很老的遊戲，出現的提示語都是一個字一個字的慢慢出現，現在python也可以實現這個效果，說不定還能用這個做個簡單的小遊戲呢，話不多說直接上代碼。

import sys
import time

question="今天，你學習了嗎？"

for word in question:
    sys.stdout.write(word)
    sys.stdout.flush()
    time.sleep(0.2)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分享一些簡單的內容

文章目錄

1.使用java簡單爬取CSDN

2.python的字符動態輸出

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

docker+scrapy+scrapy_splash爬取大麥網

Go來合併兩個csv

tensorflow-gpu以及jupyter kernel添加新創建虛擬環境的安裝配置

程序猿的長壽指南？

前端基礎一些關於html基本的介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結