学会用python网络爬虫爬取斗图网的表情包，聊微信再也不怕斗图了

原創

2020-02-22 12:00

最近总是有人跟我斗图，想了想17年中旬时在网上看过一篇关于爬取斗图网表情包的py代码，但是刚想爬的时候发现网页结构发生了变化，而且斗图网还插入了很多广告，变化其实挺大的，所以临时写了一个爬虫，简单的爬取了斗图网的表情包。从这链接上看，page表示的是第几页，我只爬取了500多页（很奇怪白天明明看到一共有一千多页的，为啥晚上就只有548页？），纯属娱乐，表情包够用就行。

这里还是要推荐下小编的Python学习群:483546416，不管你是小白还是大牛，小编我都欢迎，不定期分享干货，包括小编自己整理的一份2017最新的Python资料和0基础入门教程，欢迎初学和进阶中的小伙伴。在不忙的时间我会给大家解惑。

重点还是在于解析网页，页面上每一栏都是一组图，这组图有一个链接指向，所以我只要提取到这个链接，再打开这个链接，然后在新的网页上提取表情图片，下载下来就行了。解析网页使用了python的xpath，剩下的就是数学思维了，循环嵌套和判断什么的。

源码截图如下（使用的是python3）：

为了保留表情的动态图效果，代码中加了判断是否为gif格式的图片。

因为网速不好，所以总共等待2秒

爬取的效果图如下：

于是可以放服务器，慢慢跑，图片下载的速度还是挺快的。

需要爬虫源码或者表情包的友友们，可以私信我。

后面爬了一部分后觉得用起来不太方便，觉得还是需要给图片命个名字，要不然真正斗图的时候，找不到对应的图片也麻烦，比较难搜索，所以加了几行代码，抓取图片名字，效果图如下，需要对应的图片时候直接搜索你想要的表情包大概的名字就可以了。修改后的源码截图就没放上去了，需要的话私信或者博客。

发布了35 篇原创文章 · 获赞 75 · 访问量 15万+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

网络爬虫安全：90后小伙，用软件非法搬运他人原创视频被判刑

央視《今日說法》欄目近日報道了一名程序員開發非法視頻搬運軟件獲利超700多萬，最終獲刑的案例。國內某知名短視頻平臺報警稱，有人在網絡上售賣一款視頻搬運軟件，使用軟件的人可以繞過平臺的審覈機制，一鍵“搬運”竊取他人作品非法轉載投稿。警方調查

2024-05-16 00:19:26

我拍了拍Redis，被移出了群聊···

01 Redis的新煩惱你好，我是Redis，一個叫Antirez的男人把我帶到了這個世界上。自從上次被拉入羣聊之後，我就從一個人單打獨鬥變成了團隊合作，在小夥伴們的共同努力下，不僅有主從複製可以數據備份，還有哨兵節點負責監控管理

2024-05-14 01:06:44

为程序员和新手准备的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

企业IT架构治理之道

一、什麼是架構和治理 1.1 架構的起源開篇還是要說說大家理解的架構，何爲架構，架構跟我們的工作和生活有什麼關係。英文Architecture本源來自於拉丁語，最早起源於建築領域，建築是文明社會一個重要的標誌，同時也是人類社會最早

京東雲開發者

2024-05-13 23:59:32

即时通讯技术文集（第 3 期）：高性能网络编程系列 [共 14 篇]

爲了更好地分類閱讀 52im.net 總計 1000 多篇精編文章，我將在每週三推送新的一期技術文集，本次是第 3 期。第 1 篇 [標題] 高性能網絡編程 (一)：單臺服務器併發 TCP 連接數到底可以有多少 [鏈接] http:

2024-05-12 11:49:46

程序员不存在了……吗？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

腾讯技术面霸挑战赛开启！破解奇葩题赢10000元现金好礼

金三銀四，求職正當時，在互聯網的技術面試中，對程序員的考察從技術知識到邏輯思維、行爲測試，乃至難度頗高的智力題，考驗臨場反應的職場高情商“送命題”。讓人大呼奇葩的技術面試題，你能破解幾道？騰訊雲開發者社區重磅推出「Offer 碼上來」

2024-05-07 23:11:16

我们团队来了一位新同事，主动要求帮忙敲代码！欢迎 AI 001号

通義靈碼｜7X24的AI智能編程助手工號：AI001 他叫通義靈碼，一個硅基生命。出生在0101星球，沒有性別，但有人格類型。他是INTJ，建築師型人格，艾薩克·牛頓和甘道夫同款。他會寫一點代碼，但不如我們會得多。我看了下他的簡歷，

2024-05-07 21:12:06

让研发规范管得住 - 我们为什么在流水线之上又做了研发流程？

作者：子醜爲什麼會有研發規範很多程序員入職一家新的公司，領完電腦再安裝完必備的開發工具，接下來最先接觸的恐怕就是新公司的研發規範了。幾乎所有的軟件企業都有或繁或簡的一套或多套研發規範，並且大部分軟件團隊都認爲他們的研發規範是不太一樣的，

2024-04-28 21:12:17

赋能开发者，腾讯云与你共探AI提升十倍生产力之路

引言 AI 技術發展迅速，對於開發者而言，AI 既可能是提高生產力的神兵利器，也可能成爲職業生涯潛在的“威脅”。開發者如何與 AI 協同進化，提升個人能力和價值；如何利用提高 AI 生產力，推動企業創新，實現降本提效

2024-04-28 11:11:17

“AI 程序员入职系列”第二弹：如何利用通义灵码光速改写项目编程语言？

通義靈碼入職阿里云云原生團隊後，已經展示過 Ta 生成單元測試和自動生成代碼的強大實力。今天，阿里雲後端工程師雲徊將從項目開發的實際需求出發，演示通義靈碼在開發工作中可提供的幫助。通義靈碼在 Git 開發項目中起到了哪些作用？雲徊所在的

2024-04-22 21:12:11

下载量超 200 万，最近频繁登上热搜的 AI 程序员，大家怎么看

人狠話不多，會熟練使用 200 多種編程語言，寫得了代碼，做得了測試，7 天 24 小時隨叫隨到…… 硅基程序員通義靈碼首次入職阿里雲，有網友說：終於不穿格子衫了！還有網友說：這簡歷，作爲一個 HR 我很難不心動！人狠話不多的通義靈碼，

2024-04-22 21:12:06

Java中的Semaphore和CountDownLatch这两个工具类的使用方法和实际应用场景

在現代的多線程編程中，Semaphore和CountDownLatch是兩個非常常見和重要的工具類，它們都可以用來實現多線程間的同步和互斥，提高程序的併發性能和效率。本文將詳細介紹Java中的Semaphore和CountDownLatch

2024-04-20 00:54:00

写给职场新人｜从迷茫到屡获殊荣的技术人成长之路

在這個時代，技術的每一次飛躍都在重塑我們的工作方式。借Up技術人專欄活動寫了這篇文章，回望一下我和計算機打交道的這幾年，希望能給學生或職場新人們一些幫助。 1.錨定方向：學生生涯的一次探險如果用一個詞語概括我的本科階段，那大概就

2024-04-19 23:17:23

王海峰：百度 500 万 AI 人才培养目标已提前达成

4 月 16 日，以“創造未來”爲主題的 Create 2024 百度 AI 開發者大會在深圳國際會展中心成功舉辦。百度首席技術官王海峯以“技術築基，星河璀璨”爲題，發表演講，解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。

2024-04-17 23:41:11

24小時熱門文章

最新文章

最新評論文章