一. 基於詞本身的相似度計算
1. TF-IDF Similarity
基於TF-IDF的相似度計算
2. edit distance
基於編輯距離的相似度計算
3. LDA Similarity
基於LDA主題模型的相似度計算
4. LSI Similarity
基於LSI主題模型的相似度計算
二. 基於詞向量的相似度計算
1. Word2Vec Similarity
2. Doc2vec Similarity
3. WMD Similarity
4. Simhash Similarity
三. 基於有監督的文本相似度計算
實現代碼鏈接爲: