【算法類】【論文筆記】Siamese Recurrent Architectures for Learning Sentence Similarity

0、 Siamese Recurrent Architectures for Learning Sentence Similarity

1、摘要

在這裏插入圖片描述
論文主要用了一個簡單的LSTM模型,通過對單詞進行編碼,最終計算相似性的一個方法,本篇論文的創新點是將wordnet中的同義詞加入進行word2vec訓練,並將預訓練的結果輸入到LSTM進行訓練。

2、方法

2.1生成詞向量

第一步利用wordnet將單詞的同義詞隨機替換訓練集中的數據,利用Word2vec生成詞向量。

2.2相似性計算

在這裏插入圖片描述
這裏LSTMa和LSTMb利用的是共享參數,最後計算相似性用的是Manhattan距離。

3實驗

在這裏插入圖片描述

4、寫在最後

這篇文章驗證了一個問題就是在預訓練詞向量效果好的情況下,簡單的LSTM是可以提取複雜的語義信息。同時,這篇文章模型很依賴外部數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章