[NLP --- 25] 文本相似度計算方法

一. 基於詞本身的相似度計算

1. TF-IDF Similarity

基於TF-IDF的相似度計算

2. edit distance

基於編輯距離的相似度計算

3. LDA Similarity

基於LDA主題模型的相似度計算

4. LSI Similarity

基於LSI主題模型的相似度計算

二. 基於詞向量的相似度計算

1. Word2Vec Similarity

2. Doc2vec Similarity

3. WMD Similarity

4. Simhash Similarity

三. 基於有監督的文本相似度計算

 

實現代碼鏈接爲: 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章