爬蟲實戰---爬取B站視頻彈幕(春物)

番名:我的青春戀愛物語果然有問題3 PV

效果圖:

在這裏插入圖片描述

源代碼:

import wordcloud  #關鍵庫:詞雲
import requests
import re
import csv

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36"}
url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=170310173'
response = requests.get(url=url,headers=headers)
html_doc = response.content.decode('utf-8')  #保證文本內容正常
format = re.compile("<d.*?>(.*?)</d>")  #因爲該網頁有兩層,所以先將該正則表達式編譯成模式對象
DanMu = format.findall(html_doc)  #再返回列表
#逐個輸出彈幕到.csv文件中
for i in DanMu:
   with open(r'D:\pytest\csv.csv',"a", newline='',encoding='utf-8-sig') as csvfile: 
    writer= csv.writer(csvfile)
    danmu = []
    danmu.append(i)
    writer.writerow(danmu)

# 從外部.txt文件中讀取大段文本,存入變量txt中
f = open('D:\pytest\csv.csv',encoding='utf-8')
txt = f.read()

# 構建詞雲對象w,設置詞雲圖片寬、高、字體、背景顏色等參數
w = wordcloud.WordCloud(width=1000, height=700, background_color='white', font_path='msyh.ttc')

# 將txt變量傳入w的generate()方法,給詞雲輸入文字
w.generate(txt)

# 將詞雲圖片導出到當前文件夾
w.to_file('D:\pytest\output.png')
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章