Text Matching as Image Recognition

一、概述

MatchPyramid來自Liang Pang等在2016發表的一篇文章Text Matching as Image Recognition,大意爲利用圖像識別的方式進行文本匹配。

二、思路

對於文本匹配,基本思路如下述公式:
這裏寫圖片描述
其中T爲文本,函數θθ代表將文本轉換爲對應的表示,函數FF則代表兩個文本表示之間的交互關係。
由側重點不同可分爲表示方法與交互方法,即注重θθ或者FF,而MatchPyramid應屬於後一種。

1、基本方法

構建文本與文本的相似度矩陣,採用CNN對矩陣進行特徵抽取,最後用softmax獲得分類概率,評價方法爲交叉熵,如下:
這裏寫圖片描述

2、流程

(1)相似度矩陣

由於CNN針對的是網格型數據,而文本顯然屬於序列數據,那麼就有必要對數據進行轉換,論文中提出了三種構建相似度矩陣的方法:
這裏寫圖片描述
0-1類型,每個序列對應的詞相同爲1,不同爲0
這裏寫圖片描述
cosine距離,使用預訓練的Glove將詞轉爲向量,之後計算序列對應的詞的cosine距離
這裏寫圖片描述
點積,同上,但是將cosine距離改爲點積
作者在文中提到,距離矩陣使用點積的效果相對較好。

(2)兩層CNN

後續利用兩層的CNN對相似度矩陣進行特徵抽取,這裏要注意的是由於上一層的相似度矩陣shape不一致,在第一層CNN後面進行maxpool的時候,要使用動態pool,有沒有其他的小trick就不可得知了。

(3)兩層MLP

最後用兩層的全連接對CNN的結果進行轉換,使用softmax函數得到最終分類概率。

三、其他

作者使用論文中的模型,在kaggle的quora數據集中得到一個相當不錯的分數,最終小組成績達到了第四名。
附實現地址:https://github.com/faneshion/MatchZoo

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章