一、說明
數據來源:貓眼;
運行環境:Win10/Python3.7 和 Win7/Python3.5;
分析工具:jieba、WorldCloud、pyecharts和matplotlib;
程序基本思路:分析接口 —> 下載數據 —> 過濾數據 —> 保存文件 —> 統計分析;
注意:本文所有圖文和源碼僅供學習,請勿他用,轉發請註明出處!
參考:https://www.cnblogs.com/reader/p/10070629.html
二、開始
樣本數據(23萬+):
因爲運行的腳本和之前基本差不多,對於數據採集和統計分析的流程直接參考:https://www.cnblogs.com/reader/p/10070629.html
優化下載部分代碼,防止因網絡原因導致下載失敗,導致的程序停止(這裏也可以考慮設置重試下載次數):
1 def download(self, url): 2 """下載內容""" 3 self.showstep('Downloading:'+url) 4 5 # 防止網絡原因導致下載失敗 6 while True: 7 try: 8 response = requests.get(url, headers=self.headers) 9 10 if response.status_code == 200: 11 return response.json() 12 else: 13 self.showstep('Download Fail:' + url) 14 return "" 15 except Exception as e: 16 print(e) 17 time.sleep(3)
三、圖形化分析
3.1 觀衆城市分佈熱點圖
3.2 觀衆位置分佈圖
3.3 城市分佈人數排行 TOP 20
3.4 詞雲