語言模型

關聯規則多用於推薦系統,但是目前大部分的推薦都是推薦關聯度高的信息。
但是可以反向使用關聯規則來幫助我們找出停滯詞(無關詞)

序列模型的採樣

在這裏插入圖片描述

gram模型的缺點:
參數係數,參數空間過大,存儲和內存吃不消
沒有考慮文本中出現過多的廢話詞,可以用tf-idf優化
沒有考慮久遠之前出現的詞語對現在的影響,可以用bigram、trigram等詞袋模型解決

你知道的越多,你不知道的越多。
有道無術,術尚可求,有術無道,止於術。
如有其它問題,歡迎大家留言,我們一起討論,一起學習,一起進步

發佈了114 篇原創文章 · 獲贊 67 · 訪問量 7997
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章