用Python網絡爬蟲帶你解析《李煥英》爲什麼值54億票房

要說今年最出圈的詞彙,《你好,李煥英》絕對算是最熱的黑馬之一。不鳴則已,一鳴驚人,這部優秀的作品更是讓賈玲榮獲“全球票房最高女導演”的稱號。


(圖片來自於“貓眼”程序)


要從感情上分析這部電影爲什麼能取得如此成功,想必大家已經看得很多,今天我們從數據分角度出發,Python分析一下這位春節檔的最大贏家——《你好,李煥英》!



首先,我們要簡單使用Python爬取豆瓣的短評數據。目前這部劇豆瓣上共有612433人進行評分,分數爲8.1分,這種評分在國產劇中是很優秀的成績了。


這裏我們使用requests並搭配xpath來爬取豆瓣評價以及評論者的個人信息。



    
    
    
from lxml  import etree
import requests


靜待十幾秒,就成功獲取了500條豆瓣評論數據👇



簡單篩選,我們就可以從500條數據統計出主演提及次數,並利用pyecharts製作條形圖。


bar = (Bar()
      .add_xaxis(x_df)
      .add_yaxis('提及次數', y_df)
      .set_global_opts(title_opts=opts.TitleOpts(title='《你好,李煥英》豆瓣評論中的主演提及次數')
                      ,visualmap_opts=opts.VisualMapOpts())
    )

bar.render_notebook()



我們通過排序可以發現,賈玲飾演的自己,張小斐飾演的李煥英是觀衆評論提及最多的角色。

我們還可以用pyecharts來製作map地圖,來展示評論者的地域分佈:



可以看到,豆瓣上給《你好,李煥英》評分的觀衆中,來自北京市的最多!


最後我們再利用stylecloud製作一個詞雲圖,看看大家主要都在評論些什麼?


stylecloud.gen_stylecloud(text=' '.join(text),
                         collocations=False,
                         icon_name='fas fa-chart-pie',
                         size=600,
                         output_name='./評論詞雲圖.png')
Image(filename='./評論詞雲圖.png')

結果如下:



豆瓣評論中主要圍繞的關鍵詞有"母親"和"女兒",以及對應的角色"賈玲"和"李煥英"。除此以外,"沈騰"、"穿越"、"反轉"、"結尾"、"小品"等關鍵詞也被多次提到。


上文就是我們用Python分析一下《你好,李煥英》這部叫好又叫座的電影了。


不過只是使用 Python 簡單給你演示一下數據分析的魅力,後續我們其實還能做深入的數據挖掘。而且,實際上數據分析除了獲取數據,存儲數據,還需要會對數據進行預處理,提取,然後分析,統計,報告等操作。


如果你對使用 Python 數據分析感興趣,想要拿到一份薪資不錯的工作,但是目前還有些許茫然,有很多不清楚的地方,比如數據分析的學習路徑是怎麼樣的?如何製作精美的可視化視圖?如何進行股票量化等等?


我這次特地總結了一張 思維導圖 給大家,點擊放大看更清楚哦。

(點擊查看高清大圖)

基於此,我這裏將我以前學習過程中用過的 電子書(技能類、統計類、業務類),還有相關視頻免費分享給大家 ,省去了你們挑選視頻的時間,也希望能夠對你們的學習有所幫助。

PS:我總結的資料有點多哦,差不多有4G,大家一定要給你的百度雲盤空出位置來哦!

(資料僅展示部分)

 

免費領取資料和大廠直播課


大家按照以下步驟,獲取我特意挑選出來的書籍、視頻。


1、掃二維碼免費報名課程(限時300個名額)

2、報名成功後添加小助手即可免費領取資料


(掃碼瞭解課程詳情)

如果遇到一些環境配置,還有一些錯誤異常等bug,資料就顯得不太夠用,這時就需要找到老師,給我們特別講解。

或者是想快速學習數據分析領域知識,不妨先找一找直播課看看,瞭解當下最貼合實際的學習思路,確定自己的方向。

 

網易直播課內容詳情


我特別推薦 網易雲課堂的 《3天數據分析實戰集訓營》 ,定期更新幹貨知識。

還有網易特邀數據架構講師——“證書狂魔”Mars老師,通過直播現場教學和實戰的同時,開放互動參 與學習,讓你的數據分析之旅快人一步!

4月13日  20:00&數據可視化入門:
60分鐘,用Tableau快速實現酷炫可視化效果
流程解析:5個關鍵步驟,掌握核心方法
過程處理:2個關鍵工具,提升工作效率
實戰項目:二手車網站數據爬取+可視化

4月14日 20:00&數據可視化進階

4個案例,用Python實現【交互式可視化報表】

入門級圖表:用Python快速實現

進階交互圖:股票價格走勢

動態趨勢圖:電商直播分析

地圖效果圖:銷售數據彙總


4月15日 20:00&量化交易入門和進階:
利用Python,快速選擇優質股票

場景工具:利用pandas工具分解KDJ指標構成

流程處理: 交易數據爬取,業務場景分析建模和可視化

分析結果:用KDJ指標模型對比特幣行情買賣點搜索&交易回溯

實戰項目:掌握根據數據指數和分析工具尋找虛擬貨幣買賣原理


他們每週都會定期分享一些乾貨供大家學習參考,對學習很有幫助。

(深度學習DeepLearning.ai實驗室認證)

(微軟/甲骨文/Cloudera等公司頒發的數據分析證書)

4步學會數據可視化,辦公效率提高三倍

(更多精彩內容 等你解鎖)

 

免費領取資料和大廠直播課

大家按照以下步驟,獲取我特意挑選出來的書籍、視頻。

1、掃二維碼免費報名課程(限時300個名額)

2、報名成功後添加小助手即可免費領取資料

(掃碼瞭解課程詳情)

如果遇到一些環境配置,還有一些錯誤異常等bug,資料就顯得不太夠用,這時就需要找到老師,給我們特別講解。

或者是想快速學習數據可視化領域知識,不妨先找一找直播課看看,瞭解當下最貼合實際的學習思路,確定自己的方向。

(記得添加小助手領資料喔,說不定你哪天就用上了)

本文分享自微信公衆號 - IT共享之家(info-share)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章