Python爬蟲入門教程 71-100 續上篇,python爬蟲爬取B站視頻

寫在前面

上篇博客我們用比較大的篇幅分析了B站視頻傳輸方式,這篇博客填一下之前留下的坑,我們把代碼部分寫出來。

文章來源:夢想橡皮擦,其實這個ID是一個組合

分析的步驟與邏輯這裏不再重複給大家演示了,可以翻看 https://blog.csdn.net/hihell/article/details/106546531 這篇文章,裏面有清晰的說明。

先記住

30280.m4s,對應音頻文件
30064.m4s,對應視頻文件

編碼時間

B站視頻雖然已經分析完畢,但是實際編碼還是有難度的,所以堅持住,我們一起搞定它。

全篇文章使用的鏈接爲:https://www.bilibili.com/video/BV1Pv41167FE ,BV鏈接,B站升級之後從AV連接提升到BV,反爬技術成倍的疊加。

通過Fiddler抓取,分析之後,我們得到了這樣的一些結論,重點如下圖所示,頁面返回狀態碼爲206,這個需要關注下

Python爬蟲入門教程 71-100 續上篇,python爬蟲爬取B站視頻
上面的圖片,可能你看的比較暈,還是不要急,點擊一個鏈接,我們需要看一下它是如何請求與返回數據的。分析之後,你會發現一個奇怪的現象,在鏈接相同的情況下,請求返回一個狀態碼是200,另一個是206。

html>

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章