urllib提供了一系列用於操作URL的功能。
import urllib.request
url = "http://www.baidu.com"
#data返回類型:<class 'http.client.HTTPResponse'>
# data = urllib.request.urlopen(url)
# data.geturl():http://www.baidu.com
data = urllib.request.urlopen(url).read()
# 編碼轉換
data = data.decode('UTF-8')
print(data)
可以用type(data)獲取data=urllib.request.urlopen(url)的返回類型是:<class 'http.client.HTTPResponse'>;
urlopen返回對象提供方法:
-read() , readline() ,readlines() , fileno() , close() :這些方法的使用方式與文件對象完全一樣
-info():返回一個httplib.HTTPMessage對象,表示遠程服務器返回的頭信息
-getcode():返回Http狀態碼。如果是http請求,200請求成功完成;404網址未找到
-geturl():返回請求的url