python抓取圖片

#!/usr/bin/env python
#_*_ coding utf-8 _*_
import re
import urllib.request
import urllib
import os

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html.decode('GBK')

def getImg(html):
    reg = r'[src=|"p_img_url":]"(http\:\/\/pic\.xxxx\.com/upload/.+?\.jpg)'
    imgre = re.compile(reg,re.I)
    imglist = imgre.findall(html)

    for imgurl in imglist:
        print(imgurl)
        urllib.request.urlretrieve(imgurl,'{}{}'.format(paths,imgurl.split("//")[1].split('/')[-1]))

#根據商品ID抓取圖片
f=open('id1.txt','r')
for i in f.readlines():
    num1=i.replace('\n','')
    path = 'D:\\test\\'+num1
    if not os.path.isdir(path):
        os.makedirs(path)
    paths = path+'\\'
    html = getHtml("http://www.xxxx.com/Product-0-%s.htm" % num1)
    getImg(html)
f.close()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章