自學Python 3網絡爬蟲(一)

urllib提供了一系列用於操作URL的功能。

import urllib.request
url = "http://www.baidu.com"
#data返回類型:<class 'http.client.HTTPResponse'>
# data = urllib.request.urlopen(url)
# data.geturl():http://www.baidu.com
data = urllib.request.urlopen(url).read()
# 編碼轉換
data = data.decode('UTF-8')
print(data)

可以用type(data)獲取data=urllib.request.urlopen(url)的返回類型是:<class 'http.client.HTTPResponse'>;

urlopen返回對象提供方法:

 -read() , readline() ,readlines() , fileno() , close() :這些方法的使用方式與文件對象完全一樣

 -info():返回一個httplib.HTTPMessage對象,表示遠程服務器返回的頭信息

 -getcode():返回Http狀態碼。如果是http請求,200請求成功完成;404網址未找到

 -geturl():返回請求的url


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章