0、 Siamese Recurrent Architectures for Learning Sentence Similarity
1、摘要
論文主要用了一個簡單的LSTM模型,通過對單詞進行編碼,最終計算相似性的一個方法,本篇論文的創新點是將wordnet中的同義詞加入進行word2vec訓練,並將預訓練的結果輸入到LSTM進行訓練。
2、方法
2.1生成詞向量
第一步利用wordnet將單詞的同義詞隨機替換訓練集中的數據,利用Word2vec生成詞向量。
2.2相似性計算
這裏LSTMa和LSTMb利用的是共享參數,最後計算相似性用的是Manhattan距離。
3實驗
4、寫在最後
這篇文章驗證了一個問題就是在預訓練詞向量效果好的情況下,簡單的LSTM是可以提取複雜的語義信息。同時,這篇文章模型很依賴外部數據。