201671010436王雪刚 词频统计软件项目报告

实验二 软件工程个人项目

实验要求链接:https://www.cnblogs.com/nwnu-daizh/p/10487329.html

 


 

  • 需求分析:

按照《构建之法》第2章中2.3所述PSP流程,使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发。
1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
总结来说,该项目需求分析为程序可读入任意10万词以内的英文文本文件,可查找文件并可统计对应单词在文本中出现的次数和柱状图,可以根据频率出现前K个单词的词频,最后还可以将统计结果输出到result.txt

 


  

  • 功能设计.
    1.读入的文件放在src下,即word.txt放入src下;
    2.输入需要查找的英文单词,显示出该单词出现的次数以及柱状图;
    3.程序可以按照文中词频数降序显示词频以及单词;
    4.程序可以统计整个文本字符流中的单词数并将结果输出到result.txt中,文件存放在src下。

 


  • 设计实现:

1.利用BufferedReader读取文件程序读取需要统计的文件;
2.用户可以输入想要查询的英文单词,将会显示出该次在文件中出现的次数等;
3.排序代码可以对用户查询的英文单词按照降序的的方式进行排列,在设计排序的时候,用Map按键排序,将字母从a到z对所分割的单词进行整理,采用按值排序(sort by value),对整体单词根据单词频数进行排序。
4.在查询结束后将单数查询结果输出并保存在相应文件夹下。


  •  测试运行:


部分代码:

 


  • 实验总结:

  通过本次实验,了解了软件开发的主要流程,因为之前对java语言掌握很少,因此在开发过程中遇到很多问题,通过上网查阅资料,对java知识有了初步的认识,在编写代码时发现所有的程序模块都是相互独立的,但是之间也存在一定的关系,在开发当中也有很多功能未能实现,在以后的学习过程当中,我会认真学习计算机语言,掌握更多的技巧,争取开发出更好的有质量的软件。

  • psp:

 


  • GitHub源代码地址:

https://github.com/201671010436/wangxuegang

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章