關於關鍵詞抽取的一些思考

問1:關鍵詞提取是怎麼做的?
答1:1)topic主題詞抽取(lda)、詞位置信息的關鍵詞抽取(KE)、標題中的詞(title)、停用詞
2)按照策略選擇5個候選關鍵詞:主題詞+標題中的詞;KE+標題中的詞;主題詞+KE;主題詞
3)topic關鍵詞抽取:分詞、特徵選擇、主題詞抽取
4)分詞:直接使用微博的分詞工具,調用接口
5)特徵選擇:卡方、互信息、特徵停用詞過濾


問2:關鍵詞提取怎麼用的?
答2:1)文章自動打標籤
2)聚合閱讀


問3:關鍵詞提取定位
答3:屬於非結構化數據進行結構化處理的一部分
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章