Text Matching as Image Recognition

原創

lpty

2020-06-07 06:38

一、概述

MatchPyramid來自Liang Pang等在2016發表的一篇文章Text Matching as Image Recognition，大意爲利用圖像識別的方式進行文本匹配。

二、思路

對於文本匹配，基本思路如下述公式：

其中T爲文本，函數 $θ$ 代表將文本轉換爲對應的表示，函數 $F$ 則代表兩個文本表示之間的交互關係。
由側重點不同可分爲表示方法與交互方法，即注重 $θ$ 或者 $F$ ，而MatchPyramid應屬於後一種。

1、基本方法

構建文本與文本的相似度矩陣，採用CNN對矩陣進行特徵抽取，最後用softmax獲得分類概率，評價方法爲交叉熵，如下：

2、流程

（1）相似度矩陣

由於CNN針對的是網格型數據，而文本顯然屬於序列數據，那麼就有必要對數據進行轉換，論文中提出了三種構建相似度矩陣的方法：

0-1類型，每個序列對應的詞相同爲1，不同爲0

cosine距離，使用預訓練的Glove將詞轉爲向量，之後計算序列對應的詞的cosine距離

點積，同上，但是將cosine距離改爲點積
作者在文中提到，距離矩陣使用點積的效果相對較好。

（2）兩層CNN

後續利用兩層的CNN對相似度矩陣進行特徵抽取，這裏要注意的是由於上一層的相似度矩陣shape不一致，在第一層CNN後面進行maxpool的時候，要使用動態pool，有沒有其他的小trick就不可得知了。

（3）兩層MLP

最後用兩層的全連接對CNN的結果進行轉換，使用softmax函數得到最終分類概率。

三、其他

作者使用論文中的模型，在kaggle的quora數據集中得到一個相當不錯的分數，最終小組成績達到了第四名。
附實現地址：https://github.com/faneshion/MatchZoo

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Text Matching as Image Recognition

一、概述

二、思路

1、基本方法

2、流程

（1）相似度矩陣

（2）兩層CNN

（3）兩層MLP

三、其他

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

How to Strike a Match

Deep Sentence Embedding Using Long Short-Term Memory Networks

Replace or Retrieve Keywords In Documents At Scale

Text Matching as Image Recognition

【WEB】本地包含

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結