貓眼電影爬取分析

此篇文章是根據https://mp.weixin.qq.com/s/rRtb8ATXrVxr3r5uLEhRtA這個文章的步驟進行爬取的。有興趣的可以直接到該作者的連接查看文章。

  介紹一下我的裝備:

  瀏覽器:谷歌瀏覽器

 

 

爬取步驟

一,到貓眼官網,電影選項,查看每個電影的連接。

選擇一個電影,右擊選擇“檢查(shift+ctrl+i)”,可以找到該電影的跳轉連接。

二、對電影詳情頁進行初步分析

右鍵檢查可以看到用戶評分,人評分,累計票房都做了反爬蟲的限制。

在開發人員工具中可以看到數字前面的class屬性爲stonefont,所以通過Ctrl+F找到獲取文字編碼的URL

得到了文字的編碼之後,需要對其進行解碼。作者是用pycharm來進行爬取的,我這邊先試一下jupyter,表示無法安裝合適的第三方包,所以我還是選擇用pycharm。

因爲原文中省略了一些步驟,所以剛開始看的時候的還有點懵。後來仔細閱讀和嘗試了一下,知道下載woff的意思是將貓眼上面的woff下載下來。直接複製粘貼上圖中format('woff')漆面的連接就可以下載下來了。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章