python入門018~python3藉助requests類庫3行代碼爬取網頁數據

今天我們來做一個簡單的python爬蟲示例,讓大家看看python爬取數據的方便之處。

先來看下我們實現的效果


本節知識點

1,python導入三方類庫的學習
2,requests類庫的簡單使用
3,爬取網頁數據

一,先把實現代碼貼出來給大家

# -*- coding:UTF-8 -*-
import requests
if __name__ == '__main__':
    target = 'http://gitbook.cn/'
    req = requests.get(url=target)
    print(req.text)

這就是本節的全部代碼,是不是很簡單,這就是python的魅力所在。用最少的代碼做最多的事。

二,創建一個python類,把上面的代碼複製進去。

如創建一個叫 pachong的類,如下圖




創建好以後,把上面第一步的代碼複製進去,這時候會報紅。



要解決這個報紅,我們就要學會導入三方類庫。

三,導入類庫

其實導入三方類庫也很簡單,有下面兩種方式。




如上面兩種方式,我們便可以輕鬆的導入類庫了。

四,運行代碼


運行完後,就可以爬取到網頁數據了,如下圖。



到這裏我們就輕鬆的實現了網頁數據的爬取,我們後面要做的就是使用正則表達式,從上圖的數據中,過濾出自己需要的數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章