學會用python網絡爬蟲爬取鬥圖網的表情包，聊微信再也不怕鬥圖了

原創

2020-02-22 12:00

最近總是有人跟我鬥圖，想了想17年中旬時在網上看過一篇關於爬取鬥圖網表情包的py代碼，但是剛想爬的時候發現網頁結構發生了變化，而且鬥圖網還插入了很多廣告，變化其實挺大的，所以臨時寫了一個爬蟲，簡單的爬取了鬥圖網的表情包。從這鏈接上看，page表示的是第幾頁，我只爬取了500多頁（很奇怪白天明明看到一共有一千多頁的，爲啥晚上就只有548頁？），純屬娛樂，表情包夠用就行。

這裏還是要推薦下小編的Python學習羣:483546416，不管你是小白還是大牛，小編我都歡迎，不定期分享乾貨，包括小編自己整理的一份2017最新的Python資料和0基礎入門教程，歡迎初學和進階中的小夥伴。在不忙的時間我會給大家解惑。

重點還是在於解析網頁，頁面上每一欄都是一組圖，這組圖有一個鏈接指向，所以我只要提取到這個鏈接，再打開這個鏈接，然後在新的網頁上提取表情圖片，下載下來就行了。解析網頁使用了python的xpath，剩下的就是數學思維了，循環嵌套和判斷什麼的。

源碼截圖如下（使用的是python3）：

爲了保留表情的動態圖效果，代碼中加了判斷是否爲gif格式的圖片。

因爲網速不好，所以總共等待2秒

爬取的效果圖如下：

於是可以放服務器，慢慢跑，圖片下載的速度還是挺快的。

需要爬蟲源碼或者表情包的友友們，可以私信我。

後面爬了一部分後覺得用起來不太方便，覺得還是需要給圖片命個名字，要不然真正鬥圖的時候，找不到對應的圖片也麻煩，比較難搜索，所以加了幾行代碼，抓取圖片名字，效果圖如下，需要對應的圖片時候直接搜索你想要的表情包大概的名字就可以了。修改後的源碼截圖就沒放上去了，需要的話私信或者博客。

發佈了35 篇原創文章 · 獲贊 75 · 訪問量 15萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

讓研發規範管得住 - 我們爲什麼在流水線之上又做了研發流程？

作者：子醜爲什麼會有研發規範很多程序員入職一家新的公司，領完電腦再安裝完必備的開發工具，接下來最先接觸的恐怕就是新公司的研發規範了。幾乎所有的軟件企業都有或繁或簡的一套或多套研發規範，並且大部分軟件團隊都認爲他們的研發規範是不太一樣的，

2024-04-28 21:12:17

賦能開發者，騰訊雲與你共探AI提升十倍生產力之路

引言 AI 技術發展迅速，對於開發者而言，AI 既可能是提高生產力的神兵利器，也可能成爲職業生涯潛在的“威脅”。開發者如何與 AI 協同進化，提升個人能力和價值；如何利用提高 AI 生產力，推動企業創新，實現降本提效

2024-04-28 11:11:17

“AI 程序員入職系列”第二彈：如何利用通義靈碼光速改寫項目編程語言？

通義靈碼入職阿里云云原生團隊後，已經展示過 Ta 生成單元測試和自動生成代碼的強大實力。今天，阿里雲後端工程師雲徊將從項目開發的實際需求出發，演示通義靈碼在開發工作中可提供的幫助。通義靈碼在 Git 開發項目中起到了哪些作用？雲徊所在的

2024-04-22 21:12:11

下載量超 200 萬，最近頻繁登上熱搜的 AI 程序員，大家怎麼看

人狠話不多，會熟練使用 200 多種編程語言，寫得了代碼，做得了測試，7 天 24 小時隨叫隨到…… 硅基程序員通義靈碼首次入職阿里雲，有網友說：終於不穿格子衫了！還有網友說：這簡歷，作爲一個 HR 我很難不心動！人狠話不多的通義靈碼，

2024-04-22 21:12:06

Java中的Semaphore和CountDownLatch這兩個工具類的使用方法和實際應用場景

在現代的多線程編程中，Semaphore和CountDownLatch是兩個非常常見和重要的工具類，它們都可以用來實現多線程間的同步和互斥，提高程序的併發性能和效率。本文將詳細介紹Java中的Semaphore和CountDownLatch

2024-04-20 00:54:00

寫給職場新人｜從迷茫到屢獲殊榮的技術人成長之路

在這個時代，技術的每一次飛躍都在重塑我們的工作方式。借Up技術人專欄活動寫了這篇文章，回望一下我和計算機打交道的這幾年，希望能給學生或職場新人們一些幫助。 1.錨定方向：學生生涯的一次探險如果用一個詞語概括我的本科階段，那大概就

2024-04-19 23:17:23

王海峯：百度 500 萬 AI 人才培養目標已提前達成

4 月 16 日，以“創造未來”爲主題的 Create 2024 百度 AI 開發者大會在深圳國際會展中心成功舉辦。百度首席技術官王海峯以“技術築基，星河璀璨”爲題，發表演講，解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。

2024-04-17 23:41:11

Qt血的教訓/細數Qt開發的各種坑/又愛又恨/歡迎圍觀留言評論

一、吐槽總結搞Qt開發十幾年了，最初從Qt4.6開始，一直追新到現在的6.7版本，中間經歷過無數的血的教訓，簡直是又愛又恨。其實Qt挺好的，但是還是要忍不住吐槽一下，本人還是希望Qt發展的越來越好，這樣我的飯碗就能保住了。 1. 版本衆多

2024-04-07 10:39:53

AI程序員上崗1年！四分之一代碼都靠TA，還能檢測修復安全漏洞！

大家好，我叫Baidu Comate，已經在百度打工一年多了，但依舊沒獲得一個像樣的工卡（借同事的P一個），畢竟在百度，幹啥都刷臉就行（驕傲臉）。作爲一名有着大模型大腦的AI程序員，我不僅精通100多種主流開發語言，甚至寫了我司四分之一

2024-04-04 09:32:51

人人都是創造者！李彥宏 2024 年首場演講劇透，這三大方向不容錯過

未來程序員會消失嗎？一個大模型能適配一切嗎？大模型太貴用不起怎麼辦？AI 時代最好用的工具長什麼樣？——這些行業熱議問題，將在兩週後得到答案。 4 月 16 日，百度創始人、董事長兼首席執行官李彥宏將在 2024 百度 Create AI

2024-04-02 11:39:42

在Java中，char 類型變量中能不能存儲一箇中文漢字？

char 類型可以存儲一箇中文漢字，因爲 Java 中使用的編碼是 Unicode（不選擇任何特定的編碼，直接使用字符在字符集中的編號，這是統一的唯一方法），一個 char 類型佔 2 個字節（16 比特），所以放一箇中文是沒問題的。注意

2024-04-02 09:31:14

AIGC: 5 IT從業者如何使用AI賦能業務?

上圖是一個使用AI生成的圖片，描述一下這篇文章的背景。程序員系統學習了OpenAI提供的api接口，並熟練利用提示詞結合業務解決業務問題。現狀講一個故事來開始今天的內容。架構師老李在技術圈裏以其卓越的技術洞察力而著稱。另一邊，C

2024-04-01 12:43:02

加密真的能加密嗎?

爲什麼說這個事呢，因爲加密本身就是一個僞命題，下面解釋：我其實思考加密這件事已經思考很久了，其實思考了至少1年了，今天偶然從一本書上看到java安全。 java有加密類，可以使用java的加

2024-03-30 11:23:45

讓 AI 幫你寫代碼，開發提效神器來了

如今，大量程序員已經習慣在 AI 輔助下進行編程。據調研，AI 編碼工具將程序員工作效率提升 50% 以上。通義靈碼是目前國內最受開發者喜愛的 AI 編碼助手，可以提供行級/函數級實時續寫、自然語言生成代碼、單元測試生成、代碼優化、註釋生

2024-03-27 21:14:11

微調工程師崗位可能並不存在，但使用 AI 編碼工具已經成爲剛需

智能編碼工具的快速普及是否會帶來全新的編程模式？“大力出奇跡”的規律還將繼續適用嗎？本文節選自 QCon 北京特別策劃圓桌節目，內容摘自阿里雲通義靈碼產品技術負責人陳鑫在圓桌對話裏的精彩回答。全文見：Sora很難跟進？微調就不是一個崗位？大

2024-03-25 21:14:02

24小時熱門文章

最新文章

最新評論文章