【算法类】【论文笔记】Siamese Recurrent Architectures for Learning Sentence Similarity

0、 Siamese Recurrent Architectures for Learning Sentence Similarity

1、摘要

在这里插入图片描述
论文主要用了一个简单的LSTM模型,通过对单词进行编码,最终计算相似性的一个方法,本篇论文的创新点是将wordnet中的同义词加入进行word2vec训练,并将预训练的结果输入到LSTM进行训练。

2、方法

2.1生成词向量

第一步利用wordnet将单词的同义词随机替换训练集中的数据,利用Word2vec生成词向量。

2.2相似性计算

在这里插入图片描述
这里LSTMa和LSTMb利用的是共享参数,最后计算相似性用的是Manhattan距离。

3实验

在这里插入图片描述

4、写在最后

这篇文章验证了一个问题就是在预训练词向量效果好的情况下,简单的LSTM是可以提取复杂的语义信息。同时,这篇文章模型很依赖外部数据。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章