[Python] 通過採集23萬條數據,對《哪吒》影評分析

一、說明

  數據來源:貓眼;

  運行環境:Win10/Python3.7 和 Win7/Python3.5;

  分析工具:jieba、WorldCloud、pyecharts和matplotlib;

  程序基本思路:分析接口 —> 下載數據 —> 過濾數據 —> 保存文件 —> 統計分析;

  注意:本文所有圖文和源碼僅供學習,請勿他用,轉發請註明出處!

  參考:https://www.cnblogs.com/reader/p/10070629.html

 

二、開始

  樣本數據(23萬+):

 

  因爲運行的腳本和之前基本差不多,對於數據採集和統計分析的流程直接參考:https://www.cnblogs.com/reader/p/10070629.html

  優化下載部分代碼,防止因網絡原因導致下載失敗,導致的程序停止(這裏也可以考慮設置重試下載次數):

 1     def download(self, url):
 2         """下載內容"""
 3         self.showstep('Downloading:'+url)
 4         
 5         # 防止網絡原因導致下載失敗
 6         while True:
 7             try:
 8                 response = requests.get(url, headers=self.headers)
 9 
10                 if response.status_code == 200:
11                     return response.json()
12                 else:
13                     self.showstep('Download Fail:' + url)
14                     return ""
15             except Exception as e:
16                 print(e)
17                 time.sleep(3)

  

三、圖形化分析

  3.1 觀衆城市分佈熱點圖

    

  3.2 觀衆位置分佈圖

  3.3 城市分佈人數排行 TOP 20

  

  3.4 詞雲

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章