语言模型

关联规则多用于推荐系统,但是目前大部分的推荐都是推荐关联度高的信息。
但是可以反向使用关联规则来帮助我们找出停滞词(无关词)

序列模型的采样

在这里插入图片描述

gram模型的缺点:
参数系数,参数空间过大,存储和内存吃不消
没有考虑文本中出现过多的废话词,可以用tf-idf优化
没有考虑久远之前出现的词语对现在的影响,可以用bigram、trigram等词袋模型解决

你知道的越多,你不知道的越多。
有道无术,术尚可求,有术无道,止于术。
如有其它问题,欢迎大家留言,我们一起讨论,一起学习,一起进步

发布了114 篇原创文章 · 获赞 67 · 访问量 7997
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章