基於python3 的百度圖片下載器

原創

懒人笔记—001

2020-06-24 16:24

自己寫了玩的一個小腳本，百度圖片下載

import re
import os
import requests
import hashlib


def dowmloadPic(html, keyword):
    pic_url = re.findall('"objURL":"(.*?)",', html, re.S)

    if len(pic_url) < 1:
        return 1

    i = 0
    for each in pic_url:
        print(i + 1, end=',')
        md5Str = hashlib.md5(each.encode("utf-8")).hexdigest()

        # 抓去鏈接
        oneStr = md5Str + '    ' + keyword + '    ' + each + '\n'
        with open('downText.txt', 'a+') as f:
            f.write(oneStr)

        # 下載圖片
        # try:
        #     pic = requests.get(each, timeout=10)
        # except requests.exceptions.ConnectionError:
        #     print('鏈接超時,跳過此操作')
        #     continue
        #
        # kz = os.path.splitext(each)[-1]
        # photo =  + keyword + '_' + str(i) + kz
        #
        # with open(photo, 'wb') as f:
        #     f.write(pic.content)
        i += 1

    print('\n')
    return 0


if __name__ == '__main__':

    word = input('enter a key word:')
    page = input('enter the page:')

    page = int(page)
    page = 1 if page < 1 else page

    url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + word + '&ct=201965323&v=flip'

    p = 1
    while (p <= page):
        print(word + ',第[' + str(p) + ']頁：')

        pn = (p - 1) * 20
        url = url + '&pn=' + str(pn)
        result = requests.get(url).content.decode('utf-8')

        code = dowmloadPic(result, word)

        if code:
            print('無相關數據,提前退出程序')
            break
        p = p + 1

    print('程序結束')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python的while循環

1.while循環的格式 while 條件: 條件滿足時，做的事情1 條件滿足時，做的事情2 條件滿足時，做的事情3 ...(省略)... demo

2023-10-10 11:37:31

python初識第二天

認識現實世界與虛擬世界的橋樑感受python帶來的魔力數據類型 Python裏，最常用的數據類型有三種——字符串(str)、整數(int)和浮點數(float) 字符串，字符串英文string，簡寫str 字符串的識別方式非常簡單—

2023-02-01 22:01:30

Python 的十大特性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Rupam Choudhary

2021-12-16 16:04:03

Python開發工程師[金融方向] Remote/Singapore (20k - 45k)

簡單介紹：要做的事：同交易員一起開發交易相關係統；能力要求：能獨立解決問題，完成項目開發，有較強的學習能力（技術和業務）品格正直，較強的心裏承壓能力；職業前景：能提供給你完全不同於互聯網公司的報酬上限，職業途徑；與一流交易員溝通機會，瞭解他

2021-12-09 17:53:05

CentOS7下配置Nginx

背景最近倒騰服務器的時候，選擇了CentOS7操作系統，在安裝配置Nginx的時候遇到了Permission Denied問題。按照chown和chmod進行配置無果，後來定位到SELinux問題。 SELinux是什麼？ When yo

2024-02-07 13:55:28

常用Linux命令、包括vi 、svn

PS: http://man.linuxde.net/vi /etc/init.d/network restart //=========================================== 更新腳本 cd /www/scr

2023-08-15 21:24:17

Linux環境下的主流技術部署（基於Docker容器）

搞了臺阿里雲服務器，準備學習下基於Docker容器的各種主流技術部署，那麼讓我們愉快的開始吧！ Docker環境安裝安裝yum-utils：yum install -y yum-utils device-mapper-pe

2023-02-25 00:27:07

BPF 和 Go: Linux 中的現代內省形式

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-20 11:08:55

10 款你不知道的 Linux 環境下的替代工具！

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-11 15:33:58

2022年，Rust 將成爲 Linux 內核第二官方語言？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 14:33:55

Linux 年度報告發布：2021 預計虧損300w，重點關注開源硬件

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-09 15:38:57

Android C++系列：Linux線程（一）概念

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"1. 什麼是線程",

2021-12-08 11:33:58

在Linux系統發行版（以CentOS7爲例）上部署ElasticSearch集羣並啓動Kibana和Logstash

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

为自己带盐

2021-12-07 10:29:04

2021 專業人士 Linux 系統 TOP 5

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-06 10:13:57

微軟在Edge不斷作死：疑似阻止用戶下載谷歌；Linux 之父怒噴桌面版 Linux；滴滴出行美股退市靴子落地...傳阿里員工福利再升級，或全面試行靈活辦公...

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-06 10:03:56

24小時熱門文章

最新文章

最新評論文章