今天我們來做一個簡單的python爬蟲示例,讓大家看看python爬取數據的方便之處。
先來看下我們實現的效果
本節知識點
1,python導入三方類庫的學習
2,requests類庫的簡單使用
3,爬取網頁數據
一,先把實現代碼貼出來給大家
# -*- coding:UTF-8 -*-
import requests
if __name__ == '__main__':
target = 'http://gitbook.cn/'
req = requests.get(url=target)
print(req.text)
這就是本節的全部代碼,是不是很簡單,這就是python的魅力所在。用最少的代碼做最多的事。
二,創建一個python類,把上面的代碼複製進去。
如創建一個叫 pachong的類,如下圖
創建好以後,把上面第一步的代碼複製進去,這時候會報紅。
要解決這個報紅,我們就要學會導入三方類庫。
三,導入類庫
其實導入三方類庫也很簡單,有下面兩種方式。
如上面兩種方式,我們便可以輕鬆的導入類庫了。
四,運行代碼
運行完後,就可以爬取到網頁數據了,如下圖。
到這裏我們就輕鬆的實現了網頁數據的爬取,我們後面要做的就是使用正則表達式,從上圖的數據中,過濾出自己需要的數據。