Python爬蟲案例Demo——某網站壁紙的爬取

原創

是超超啊！

2020-06-21 23:56

這是當時第二天的案例，是一個著名的高清壁紙網站：

import requests
import re
url = "https://wallhaven.cc/"
headers = {
    "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"
}
response = requests.get(url,headers = headers)
response.encoding = response.apparent_encoding
html = response.text


# https://wallhaven.cc/w/j5k825
# <a href="https://wallhaven.cc/w/j5k825"><img src="https://th.wallhaven.cc/small/j5/j5k825.jpg" width="300px" alt="" /></a>
result = re.findall('<a href="(.*?)"><img src="(.*?)" width="(.*?)" alt="" /></a>',html)
for url in result:
    new_url = str(url).split(',')[1]
    urls = eval(new_url)
    print(urls)
    image_response = requests.get(urls, headers=headers)
    # image = image_response.replace("/'",'')
    filename = new_url.split('/')[-1].split("'")[0]
    with open(str(filename), mode="wb") as t:
        t.write(image_response.content)

截止到目前爲止，這些代碼是可以運行的，大家可以看下Pycharm中的運行結果：

爬取的照片結果是：

這是第二天的案例，大家可以加上一些換頁的操作等等！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python入門系列10-Python的註釋

在任何的編程語言中，註釋都不是被用來給電腦執行的，但是註釋在編寫代碼的過程中是非常有必要的。雖然我們可以在代碼中不寫任何註釋，但是我不推薦這麼做，因爲註釋在我們日後回來閱讀之前寫的代碼將起很大的作用。註釋可以讓我們閱讀自己的或者

理想年薪百万

2020-07-06 10:23:12

Python入門系列9-Python數據類型

計算機編程語言的使命就是讓電腦幫人類進行各種複雜的運算，既然要運算就要用到各種數據類型。相信我們對數據並不陌生，從小學數學就跟各種數字打交道。但是這裏的數據類型包括很多種，不單單指數字一種。 Python中的數據類型有這麼幾種：整

理想年薪百万

2020-07-06 10:23:12

Python入門系列7-用集成開發環境（IDE）寫Python代碼

雖然我們只要一臺安裝了Python的電腦、電腦上有一款文本編輯器，還有會打字。我們就可以愉快的編寫好玩的Python代碼，驗證我們千奇百怪的想法。但是，作爲一門非常成熟並且擁有衆多擁躉的高級計算機編程語言，市面上有很多的用於開發

理想年薪百万

2020-07-06 10:23:12

Python應該怎麼學？

最近，有小夥伴問我“如何學習Python？”，我給出的建議是首先要做好一個心理準備，Python學習過程真的很痛苦，其次要選擇好python2還是python3,。然後學習的時候要多看書多學習。今天，小編整理了一下詳細的如何學習Pytho

Python新手学习之家

2020-07-02 13:55:42

工欲善其事必先利其器，Python學前準備gVim

如果你看了昨日的文章Python學前準備--如果你知道要去哪，那麼全世界都給你讓路，那麼恭喜你，已經開始了一段奮鬥向上的旅程。不多說，直接開始今天的分享內容。本次課程目標一、軟件開發的技巧衆所周知，軟件開發技術是 IT

2020-07-02 09:08:52

Python簡單又好玩的項目推薦！【持續更新】

目錄一行代碼實現心形圖案二行代碼製作專屬動態二維碼四行代碼生成專屬詞雲：五行代碼繪製多邊形線條：十行代碼繪製太陽花：二十行代碼實現井字棋遊戲二十五行代碼圖片轉字符畫三十行代碼爬取任意百度圖片 Hello！大家好哇！我是努力

2020-07-01 07:44:19

2019PLAGH-MIT醫療大數據學術交流及Datathon活動正式開始，Workshop環節精彩紛呈

2019年11月14日，由中國人民解放軍總醫院聯合麻省理工學院、哈佛醫學院、清華大學數據科學研究院、《中國醫療設備》雜誌社、中國醫院協會醫學工程專業委員會、北京生理科學院危重症醫學專業委員會共同舉辦的"2019中國醫院協會醫學工

2020-06-26 00:38:35

Python求解最長連續序列的問題！

第一次做算法題，真的很難！題目要求是：輸入一系列數字（以空格分開），算出這個數字列表的最長的連續序列，這裏的連續序列的意思是：存在連續的數字（後面的數比前面的數大1），eg：輸入的數是：3520 4 3 89 56 88 3521 9

是超超啊！

2020-06-22 00:39:42

Python爬蟲案例Demo——51job招聘信息的爬取

這是第三個案例，也是我第二天爬的，代碼如下： Pycharm的運行效果是：最後爬取的效果是：樣式有點醜哈！

是超超啊！

2020-06-21 23:56:23

Django幾條命令，一定要牢記(Python學習筆記)

Django項目搭建流程流程（切記使用中文）安裝包安裝下載安裝包，解壓運行 python setup.py install 命令安裝 python -m pip install django 新建一個 django project

2020-06-20 14:44:30

用異步ajax（jquery）請求後臺接口數據，實現echarts圖表頁面動態刷新

在看這篇文章，建議大家看下下面鏈接文章： https://blog.csdn.net/ITLearnHall/article/details/102527961 首先給大家說一下頁面動態刷新的優點與缺點，優點：頁面不需要手動刷新，數據動態

2020-06-20 13:34:30

Python學習筆記：程序流程控制

程序流程控制順序結構選擇結構分支結構的形式單分支結構雙分支結構多分支結構循環結構可迭代對象range對象for循環while循環循環的嵌套break語句continue語句else子句循環語句典型示例代碼 Python程序中語

2020-06-19 02:39:59

Python學習筆記：常用內置數據類型

常用內置數據類型Python內置數據類型概述數值數據類型序列數據類型集合數據類型字典數據類型int數據類型（任意精度整數）整型字面量int對象int對象的方法整數的運算float類型（有限精度浮點數）浮點類型字面量float對象f

2020-06-19 02:39:59

Python常用庫 - 【持續整理歸檔】

Python常用庫 - 【持續整理歸檔】，比較多，會逐步慢慢細化分類和擴從python常用庫。（最後更新：2020-4-8）爲方便Python開發人員進行敏捷開發，高效的完成工作需求，耗時很久整理的Python常用庫。目錄 1、管理

陪代码一起浪迹天涯

2020-06-17 03:11:21

python 向二維數組中追加元素

https://www.cnblogs.com/btchenguang/archive/2012/01/30/2332479.html

白日梦想嘉

2020-06-16 12:55:58

24小時熱門文章

最新文章

最新評論文章