下載圖片-使用beautifulSoup模塊

圖片處理 - 使用beautifulSoup模塊

標籤(空格分隔): python


使用beautifulSoup模塊

使用BeautifulSoup對HTML內容解析之後,HTML內容就變成了結構化數據,可以輕易對其中的DOM元素進行操作,比如獲取數據,修改,刪除等。

from bs4 import BeautifulSoup
import urllib,urllib2

def getContext(url):
    '''
    獲取html
    '''
    html = urllib2.urlopen(url).read()

    return html

def getImages(html):
    soup = BeautifulSoup(html)

    allPic = soup.findAll('img',class_="BDE_Image")

    for imgUrl in allPic:
        print imgUrl['src']

    # return a list

    return [imgUrl['src'] for imgUrl in allPic]

def downLoadPicture(urlList):

    i = 1
    for item in urlList:
        urllib.urlretrieve(item, '%s.jpg' % i)
        i +=1

url = 'http://tieba.baidu.com/p/3932177087'        
if __name__=='__main__':
    html = getContext(url)

    urls = getImages(html)

    downLoadPicture(urls)

beautifulSoup中文文檔

發佈了266 篇原創文章 · 獲贊 9 · 訪問量 23萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章