python寫個圖片爬蟲

[root@MGServer pythonscript]# vim getimg.py 

#!/usr/bin/python

#encoding:utf8

import requests,sys,re

#定義一個方法,獲取網站圖片,並下載

def getimg(url):

    #請求url內容

    page=requests.get(url)

    #獲取內容

    pagetext=page.content

    #定義正則表達式。

    reg=r'src=.*?\.jpg'

    #對獲取的內容進行匹配

    imglist=re.findall(reg,pagetext)

    #爲保存的圖片文件命名

    imgname=1

    #循環獲取帶有src的url地址列表

    for x in imglist:

        #刪除url中的前面src=字段

        x=x.lstrip('src="')

        try:

            #下載圖片

            img=requests.get(x)

            #打開文件,由於imgname是用int遞增,所以要使用str把imgname變成str。

            of=open('/root/'+str(imgname)+".jpg",'wb')

            #保存文件

            of.write(img.content)

            #關閉文件打開操作

            of.close()

            #文件名遞增

            imgname+=1

        except IOError,e:

            print "url is error:"+str(e)

            #sys.exit(1)

            #發生錯誤忽略

            pass

#執行定義的函數

getimg(sys.argv[1])

執行方法:

python getimg.py  http://www.163.com


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章