BeautifulSoup获取网页为乱码的解决

1、扒取网页

        req = requests.get(url = target)
        html = req.text
        bf = BeautifulSoup(html,'html.parser')
        texts = bf.find_all('a')
        print(texts)

 2、输出结果

 

 

 3、F12查看原页面

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

4、估计是默认使用的编码不对,页面内容取回后先指定解码方式,试试。

代码:

        req = requests.get(url = target)
        req.encoding='utf-8' #指定编码格式,解决中文乱码显示
        html = req.text
        bf = BeautifulSoup(html,'html.parser')
        texts = bf.find_all('a')
        print(texts)

结果:

 

 

5、问题解决

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章