國務院政府工作報告(1954—2017)文本挖掘及社會變遷研究

魏偉, 郭崇慧, 陳靜鋒. 國務院政府工作報告 (1954—2017) 文本挖掘及社會變遷研究[J]. 情報學報, 2018, 37(4): 406-421.

計算社會經濟學
文本大數據分析在經濟學和金融學中的應用:一個文獻綜述
【視頻課】Python爬蟲與文本數據分析
2019·國慶·杭州 | Python爬蟲與文本分析工作坊


每個人(公司、政府)都會有自己表達方式,比如口頭禪爲例,小的時候經常"臥槽",稍微文明點"我去",比較在意言語文明後OMG"。

對於每個實體(個人、公司、政府)措辭,從時間上看既有前後連續表現出的共性,也有從時間上看錶現出的變遷。已有的研究中雖部分使用了自然語言處理及文 本分析方法, 但在其做後續分析時存在研究的不深入、方法較單一以及內容分析上的單方面性和主觀性等一些不足之處。如根據人的經驗知識選擇特定的能夠有較合理解釋的詞,進行相關方面的分析;或是有針對性地抽取出國務院政府工作報告中特定 單方面的內容進行定性分析, 這些做法都不能客觀地反映出國務院政府工作報告中真實的內容。已有的研究缺少對國務院政府工作報告的綜合性研究, 並且仍然存在許多複雜的問題未進行研究, 在以下方面的研究上存在有待深入探討的問題:如何用文本挖掘方法:

  • 如何有效地挖掘出歷年國務院政府工作報 告探討的共性問題;

  • 如何有效地挖掘出歷年國務院政府工作報 告關注的熱點問題及其發展變化規律;

  • 如何從歷年國務院政府工作報告中度量歷 年的社會活力變化;

  • 歷年國務院政府工作報告中詞語的使用是否存在共同的模式;

我覺得這篇文章的挖掘文本信息的算法挺實用的,雖然目前在谷歌學術引用量爲0,但想象空間很大。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章