Python统计小说中出场人物词频

原創

2020-06-26 10:40

# 选择喜欢的小说，统计出场人物词频排名
import jieba
excludes = {"人马","都督","后主","军马","主公", "孔明曰","左右","东吴",\
"于是","知道","众将","大喜","二人", "玄德曰","天下",\
"军士","引兵","陛下","次日", "丞相","如此","商议","魏兵",\
"只见","今日","却说","不是", "将军","不可","不能","荆州",\
"不知","这个","如何","一人","汉中","蜀兵","不敢","大叫",}
f = open("三国演义.txt", "r")
txt = f.read()
f.close()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1: #排除单个字符的分词结果
continue
else:
counts[word] = counts.get(word,0) + 1
for word in excludes:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(15):
word, count = items[i]
print ("{0:<10}{1:>5}".format(word, count))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

python绘制一个边长为200的太阳花

# python繪製一個邊長爲200的太陽花 import turtle turtle.color("red","yellow") turtle.begin_fill() for i in range(36): turtle.fd

2020-06-28 22:16:05

统计不同字符的个数。用户从键盘输入一行字符，编写一个程序，统计并输出其中的英文字符、数字、空格和其他字符的个数。

#統計不同字符的個數。用戶從鍵盤輸入一行字符，編寫一個程序，統計並輸出其中的英文字符、數字、空格和其他字符的個數。 s=input("請輸入一行字符：\n") alpha,num,space,other=0,0,0,0 for i in

2020-06-26 10:40:47

假设有一个英文文本文件，编写一个程序读取其内容并将里面的大写字母变成小写字母，小写字母变成大写字母

假設有一個英文文本文件，編寫一個程序讀取其內容並將裏面的大寫字母變成小寫字母，小寫字母變成大寫字母。 ********************************************************************

2020-06-26 10:40:45

Python求两个整数的最大公约数和最小公倍数

#獲取兩個整數，求這兩個整數的最大公約數和最小公倍數。最大公約數計算一般使用輾轉相除法，最小公倍數計算則使用兩個數##的乘積除以最小公倍數。 s1=int(input("請輸入第一個整數：")) s2=int(input("請輸入第二個整

2020-06-26 10:40:45

You are using pip version 9.0.1, however version 19.2.3 is available. You should consider upgrading

You are using pip version 9.0.1, however version 19.2.3 is available.You should consider upgrading via the 'python -m p

2020-06-26 10:40:45

编写一个程序，对给定字符串中出现的全部字符（含中文字符）频率，进行分析，采用降序输出。

Python編寫一個程序，中文字符頻率統計。編寫一個程序，對給定字符串中出現的全部字符（含中文字符）頻率 ##進行分析，採用降序輸出。 txt=input("請輸入一段文本：\n") counts={} for i in txt:

2020-06-26 10:40:45

输入一个文件和一个字符，统计该字符在文件中出现的次数

輸入一個文件和一個字符，統計該字符在文件中出現的次數 *********************************************************************** def times(filename,c

2020-06-26 10:40:45

Python第三方库的获取和安装

Python第三方庫安裝方式主要有三種：1.pip工具安裝；2.自定義安裝；3.文件安裝。 1.pip工具安裝 pip安裝需要聯網，默認從網絡上載pygame庫安裝文件並自動安裝到系統中。通過pip可以安裝超過95%以上的第三方庫。在Ma

2020-06-26 10:40:45

Python随机密码生成

##隨機密碼生成。編寫程序在26個字母大小寫和9個數字組成的列表中隨機生成10個8位密碼。 ****************************************************************** import

2020-06-26 10:40:44

pycharm创建Django工程

前言 python是腳本語言，不需要編譯即可直接運行，特別適合在命令行終端中使用。而在Windows這種命令行不方便的系統中使用一款優秀的IDE不僅可以格式化代碼也能夠擁有智能化的輸入提醒，從而加快開發效率。最近JetBrains官網進不

2020-06-22 07:22:21

xlwings - 报表自动换算、汇总

文章目錄需求現狀解決方案環境 & 工具主函數代碼流程圖代碼代碼打包注意事項需求 excel報表自動彙總。現狀解決方案 1.基於Python的xlwings包，完成報表數據轉換、換算、彙總。 2.使用PyInstaller

Fergus-Firechan

2020-06-14 02:08:01

详解使用Python爬取豆瓣短评并绘制词云

2020-06-03 17:43:08

利用pydub和baidu语音api实现自动添加字幕

2020-06-01 12:11:10

【案例】批量处理 excel 并上载到数据库

Fergus-Firechan

2020-05-13 22:02:30

【案例】构建动态 sql 实现查询数据写入 excel 模版

Fergus-Firechan

2020-05-07 09:52:50

24小時熱門文章

最新文章

最新評論文章