原创 深淺copy詳解

深淺copy 前言:深淺copy會在很多面試題中都會問到,所以搞懂它們之間的區別是很有必要性的 本篇中的所有圖解只是幫助大家進行理解 1. 可變與不可變數據類型 可變數據類型:列表,字典,集合 不可變數據類型:字符串,元組,數字

原创 python集合數據類型詳解

集合 前言:首先我問大家幾個問題,什麼是集合?集合的作用是什麼?集合是可變的數據類型嗎?下面我們就按照這些問題進行展開。 什麼是集合? 由不同元素組成的集合,集合是一組無序排列 可hash值,可作爲字典的key。集合的目的是

原创 細談python集合

集合 前言:首先我問大家幾個問題,什麼是集合?集合的作用是什麼?集合是可變的數據類型嗎?下面我們就按照這些問題進行展開。 什麼是集合? 由不同元素組成的集合,集合是一組無序排列 可hash值,可作爲字典的key。集合的目的是

原创 爬取全網小說(2)

python爬取全網小說 前言:上一篇文章講了怎麼獲取所有小說的唯一編號,然後將編號進行拼接就可以得到小說的所有章節的頁面。這次我們來講講怎麼將所有小說的內容下載下來。上一篇文章地址:爬取全網小說(1) 結果如下: 1. 分析整

原创 爬取全網小說(1)

python爬取全網小說 前言:想必大家都有過看小說時突然彈出來廣告的煩惱吧,今天我就來教大家怎麼去下載用戶指定的小說。 1. 分析頁面 a) 我們首先找到小說的章節地址,分析發現每個小說都有一個唯一的編號。那我們只需要找到小說的

原创 fake-usergent報錯一勞永逸解決辦法

處理fake-useragent報錯 1. 報錯如下: fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached 原因:fake-us

原创 爬取用戶輸入的所有百度圖片

爬取百度圖片 前言:今天我們要爬取的是百度圖片,最終目的是下載用戶輸入的任何類型 圖片 1. 分析網頁,確定是動態還是靜態網頁 首先我們先打開百度圖片,右鍵檢查然後搜索二次元,對網頁進行分析,發現是ajax動態加載的

原创 爬取嗶哩嗶哩中的cosplay小視頻

爬取嗶哩嗶哩小視頻 前言:想必大家都對小視頻感興趣吧,今天的爬蟲的內容爲將嗶哩嗶哩中的視頻下載到本地,今天爬取的網站爲 URL : https://vc.bilibili.com/p/eden/all#/?tab=%E5%BE%A

原创 多線程爬取小米商城應用信息

多線程爬取小米商城 前言:想必大家對python的多線程還不是很瞭解吧,今天我們的學習任務就是怎麼使用多線程去爬取小米商城的App應用 1. 分析目標站點 目標URL : http://app.mi.com/category/15

原创 分析爬取網易雲音樂

爬取網易雲音樂 本章說的是在網易雲中搜索某音樂或者歌手,從而下載搜索的內容的文章 外鏈地址: http://music.163.com/song/media/outer/url?id={}.mp3,外鏈是需要記住的,找是很難找到的