獲取HTML資源
主要模塊爲urllib.request
1、使用urlopen和urlretrieve獲取http資源
和open內置方法可以讀取文件一樣,urlopen可以用來讀取url資源。不同的是,urlopen不能對獲取的資源數據進行seek操作,而是返回值中包含一個可讀文件的handler,從而可以對文件進行讀取。
>>> from urllib.request import urlopen
>>> f=urlopen("http://192.168.90.162") #注意,讀取網絡數據需一定時間,這裏將會使用阻塞模式,需等待一段時間
>>> f.read()
b'<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.
針對數據來實現相應的文件操作,包括部分讀取等。
from urllib.request import urlopen
fp=urlopen("http://www.python.org")
op=open("d:\python.html",'wb')
n=0
while True:
s=fp.read(1024)
if not s:
break
op.write(s)
n=n+1024
fp.close()
op.close()