【NLP】LDA笔记之模型评估

原創

2020-07-04 20:37

Reference

Number of topics

Plexity OR maximum likelihood estimation

使用R语言进行主题发现：https://www.cnblogs.com/deeplearningfans/p/4114892.html

要在数据集中确定主题的个数，需要事先设定主题个数的搜索范围；然后分别使用LDA计算主题模型在不同主题数目下的困惑度或者似然估计数值，最终能够使得模型困惑度最低或者似然估计值最大的主题数即为最佳的主题个数。一般为了降低困惑度，通常还会采取交叉验证的方法进行。（由似然估计判别：抽取每个主题的对数似然估计值，计算各个主题的调和平均数，将其作为模型的最大似然估计）

图源《Trends in Diatom Research Since 1991 Based on Topic Modeling》

准确率

Perplexity

theory

python下进行lda主题挖掘(三)——计算困惑度perplexity

评估LDA主题模型-perflexity：LDA主题模型好坏的评估，判断改进的参数或者算法的建模能力。

code

topic-models-evaluation-in-gensim

Topic Coherence

gensim: CV Conference OR UMass Conference

主题模型TopicModel：LDA主题模型的评估

https://github.com/fozziethebeat/TopicModelComparison

查全率(recall)、查准率(precision)、F1值(F1 score)

《主题模型在基于社交媒体的灾害分类中的应用及比较》对比LDA与BTM模型性能：分别从LDA、BTM模型（Bi-term Topic Model, BTM双词对主题模型）推断结果中的每一类随机抽取出 102 条、101 条进行人工判别检验，人为地将原文本归到该8个大类中。（将2种模型推断主题的结果与人工判别主题结果进行精度检验和比对，并且对模型的分类结果进行应用分析）

《基于主题模型的微博话题检测算法》：实验评估采用信息检测领域最常用的 3 个评价指标：准确率 P（precision）——结果中有多少是准确的、召回率即查全率 R（recall）——所有准确的结果中有多少被检测出来；综合评价指标 F 值（F-value）——准确率与召回率的综合评价参数。

定量+定性评价

《不同语料下基于LDA主题模型的科学文献主题抽取效果分析》

定量评价：查准率、查全率和 F 值；信息熵。定性评价：主题抽取的广度（所抽取的有效主题在本学科领域内的覆盖范围）和主题粒度（主题的细化程度）。主题抽取的广度越广，抽取的主题粒度越细，则主题抽取的效果越好。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【NLP】LDA笔记之模型评估

Reference

Number of topics

Plexity OR maximum likelihood estimation

准确率

Perplexity

theory

code

Topic Coherence

查全率(recall)、查准率(precision)、F1值(F1 score)

定量+定性评价

.NET有哪些好用的定时任务调度框架

Python 将PDF转为PDF/A、PDF/X，以及PDF/A转回PDF

elk3

Kafka存储机制

aws语音呼叫调用，告警电话

深度学习框架火焰图pprof和CUDA Nsys配置指南

【转】[C#] WebAPI 防止并发调用二（冥等性）

爬虫两种绕过5s盾的方法

【转】[SQL Server]关掉 SSMS 的 IntelliSense

号称能打败MLP的KAN到底行不行？数学核心原理全面解析

【Python】100基礎例（1-50）+數據分析例

【NLP】預訓練詞向量

【NLP】LDA2Vec筆記（基於cemoody/lda2vec 未實現）

【Python】面向對象_菜鳥教程

【NLP】英文數據預處理___詞幹/詞元處理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結