0、 Siamese Recurrent Architectures for Learning Sentence Similarity
1、摘要
论文主要用了一个简单的LSTM模型,通过对单词进行编码,最终计算相似性的一个方法,本篇论文的创新点是将wordnet中的同义词加入进行word2vec训练,并将预训练的结果输入到LSTM进行训练。
2、方法
2.1生成词向量
第一步利用wordnet将单词的同义词随机替换训练集中的数据,利用Word2vec生成词向量。
2.2相似性计算
这里LSTMa和LSTMb利用的是共享参数,最后计算相似性用的是Manhattan距离。
3实验
4、写在最后
这篇文章验证了一个问题就是在预训练词向量效果好的情况下,简单的LSTM是可以提取复杂的语义信息。同时,这篇文章模型很依赖外部数据。