python爬蟲【二】爬取新聞

原創

viafcccy

2018-12-23 18:32

在一個新聞站點或者絢麗的網頁會有許多id和class 我們可以通過觀察來看到我們需要的信息在那些id和class下

但是這裏介紹兩種快速便捷的方法

第一種使用谷歌瀏覽器自帶的開發者工具

或者安裝infolite插件安裝方法看這篇https://blog.csdn.net/viafcccy/article/details/85221588

點擊打開infolite工具

直接點擊需要的位置就可出現相應的語句

可以看到紅色的和我們需要的不一樣是廣告

我們通過觀察可以發現

我們使用這兩個工具就可以快速爬取指定的標籤

impot requests
from bs4 import BeautifulSoup
res = requests.get('url')
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text,'html.parser')
for news in soup.select('.類的名稱'):
	if len(news.select('標籤名稱')) > 0:
		變量名 = news.select('.類名稱/標籤名')[0].text
		print(變量名)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python爬蟲【二】爬取新聞

c語言實現貪吃蛇教程

(*visit)(TElemType e )函數指針理解

數據結構——樹知識點總結（一）

TensorFlow（十一）AlexNet網絡（貓狗大戰）詳解與代碼實現

TensorFlow（十四）CNN網絡架構演進：從LeNet到DenseNet

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結