用python的re庫統計《鬥破蒼穹》詞頻

一:直接上代碼,代碼很簡單的,純屬娛樂

import re
with open(r'C:\Users\admin\Desktop\computer\dp.txt','r', encoding='gb18030') as f:
    txt = f.read()

a = 1
while a:
    a = input('輸入:')
    rel=re.compile(a)
    rell=rel.findall(txt)
    print(len(rell))


主要步驟:
1: 導入re正則表達庫
2: 下載鬥破小說,打開文本文件
3: 獲取用戶輸入,利用正則表達式進行匹配
4: 匹配返回一個列表,列表長度就是該詞的數量

代碼實現的前提是在對應的目錄中下載了鬥破的txt文本

二:接下來,讓我們惡趣味的統計一下¥_¥

先看看和蕭炎有淵源的女人
在這裏插入圖片描述
女主的出現頻率有點低呢,可能是我的輸入詞彙不對

在這裏插入圖片描述
還有一些補充
在這裏插入圖片描述
這次實驗的鬥破是無錯字純淨版,如果是老版的鬥破,可能結果又不盡相同了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章