AAAI 2021 | 從語義關係建模的角度進行句子語義關係匹配

原創

osc_kedi1mvz

2021-01-30 10:26

©PaperWeekly 原創 · 作者｜張琨

學校｜中國科學技術大學博士生

研究方向｜自然語言處理

論文標題：

Making the Relation Matters: Relation of Relation Learning Network for Sentence Semantic Matching

論文作者：

Kun Zhang, Le Wu, Guangyi Lv, Meng Wang, Enhong Chen, Shulan Ruan

論文鏈接：

https://arxiv.org/abs/2012.08920

動機

句子語義關係匹配是自然語言處理中基礎但重要的一項任務，並且有着廣泛的應用場景，檢索，對話，問答等實際場景都會用到。現有的方法可以大致分爲兩類：一類是直接對句子本身進行建模，利用 BERT，LSTM 等方法，或者生成語義表示向量在進行匹配分析，或者從細粒度的角度直接分析詞，短語之間的匹配；另一類還考慮了標籤的信息，因爲標籤也包含了一定的語義信息，通過 label embedding 的方法補充豐富的信息，從而得到句子語義匹配的關係。

本文認爲標籤的語義更多的指明瞭兩個句子的語義關係，而這部分是被現有研究忽略的，通過對語義關係的挖掘能夠更深入的挖掘句子的語義信息，抽取與語義關係相關的特徵，實現更好的句子語義關係建模。爲此，本文提出了 relation of relation modeling，從語義關係建模的角度進行句子語義關係匹配建模分析。

方法

首先是模型圖，整體模型分爲兩部分，第一部分是編碼部分，第二部分是關係識別部分。

2.1 編碼部分

這部分相對比較常規，首先輸入句子進行拼接之後送給 BERT 進行處理，得到全局的語義表示，這裏作者借鑑了 ELMo 的思想，選擇 BERT 每一層的輸出，然後通過任務相關的加權得到合適的句子中每個詞的表示，具體如下：

在此基礎上，考慮到 BERT 關注的更多的全局信息，對一些局部特徵的建模還有所欠缺，作者在這裏使用了 CNN 進行局部特徵抽取，通過利用不同尺寸的卷積覈實現更全面的局部特徵抽取：

2.2 關係識別部分

這部分是本文主要的貢獻之處，本文首先設計了一個關係的關係分類任務（Relation of Relation Classification），用於判斷輸入的兩對句子對的語義關係是否相同，是一個二分類問題，可以形式化表述爲：

2.2.1 關係的關係分類

針對這個問題，本文借鑑自監督學習（self-supervised learning）的思想設計了一個關係的關係分類模塊，要求輸入兩個句子，通過簡單的啓發式匹配，然後利用一個 MLP 進行二分類，模型圖中的子圖 D 展示了具體的結構，相關的過程可以表示爲：

2.2.2 關係的對比學習

除此之外，爲了進一步準確建模句子關係的關係，作者還將對比學習引入到這個模塊中，由於模型最終會學習到一個句子對的語義關係表示向量，因此，作者通過對比學習要求模型學習的語義關係表示向量在表示相同語義關係的時候要近一些，在表示不同語義關係時要距離的遠一些，從而使得模型能夠真正學習到與關係相關的一些不變特徵，充分發揮對比學習的作用。具體而言，作者首先利用 MLP 將三個不同輸入的語義關係表示向量映射到同一空間，然後分別計算正例對和負例對之間的距離，用於最後的計算。