獲取html資源

獲取HTML資源

主要模塊爲urllib.request

1、使用urlopen和urlretrieve獲取http資源

和open內置方法可以讀取文件一樣,urlopen可以用來讀取url資源。不同的是,urlopen不能對獲取的資源數據進行seek操作,而是返回值中包含一個可讀文件的handler,從而可以對文件進行讀取。

>>> from urllib.request import urlopen
>>> f=urlopen("http://192.168.90.162") #注意,讀取網絡數據需一定時間,這裏將會使用阻塞模式,需等待一段時間
>>> f.read()
b'<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.

針對數據來實現相應的文件操作,包括部分讀取等。

from urllib.request import urlopen
fp=urlopen("http://www.python.org")
op=open("d:\python.html",'wb')
n=0
while True:
    s=fp.read(1024)
    if not s:
        break
    op.write(s)
    n=n+1024
fp.close()
op.close()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章