从豆瓣爬取并下载对应关键字的全部图片（以周杰伦为例）

原創

2020-06-19 04:46

源码

import requests
import json

def download(src, id):
    dir = './' + str(id) + '.jpg'
    try:
        pic = requests.get(src, timeout=10)
    except requests.exceptions.ConnectionError:
        # print 'error, %d 当前图片无法下载', %id
        print('图片无法下载')
    fp = open(dir, 'wb')
    fp.write(pic.content)
    fp.close()

def loop_request(total, text):
    for i in range(0, total, 20):
        url = 'https://www.douban.com/j/search_photo?q=' + text + '&limit=20&start=' + str(i)
        html = requests.get(url).text  # 得到返回结果
        response = json.loads(html, encoding='utf-8')  # 将JSON格式转换成Python对象
        for image in response['images']:
            print('downloading ' + image['src'])
            # 查看当前下载的图片网址
            download(image['src'], image['id'])  # 下载一张图片

def get_count(text):
    url = 'https://www.douban.com/j/search_photo?q=' + text + '&limit=20&start=1'
    html = json.loads(requests.get(url).text, encoding='utf-8')
    print(html)
    print(html['total'])
    loop_request(html['total'], text)

get_count('周杰伦')

简要说明

其中包含三个函数
get_count用于获取该关键字对应图片的数量
loop_request根据图片总数量，20个一组获取图片
download下载图片并根据id保存至本地

环境介绍

python版本 3.0+
开发工具 PyCharm

END

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

从豆瓣爬取并下载对应关键字的全部图片（以周杰伦为例）

源码

简要说明

环境介绍

END

Nginx R31 doc 官方文档-01-nginx 如何安装

Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

字节面试：MySQL什么时候锁表？如何防止锁表？

.NET8连接SQL SERVER 2008 R2 报：证书链是由不受信任的颁发机构颁发的

golang开发环境搭建(win10)

python计算机视觉学习笔记——PIL库的用法

小白也能徹底理解的prototype原型鏈第一篇

三分鐘搞懂es6 Symbols

環信無需對方同意直接添加好友

python黑科技：一句代碼啓動一個http服務

從豆瓣爬取並下載對應關鍵字的全部圖片（以周杰倫爲例）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結