論文淺嘗 | PAKDD2020 - 利用支持集中匹配信息的 few shot 事件分類方法

論文筆記整理：申時榮，東南大學博士生。

來源：PAKDD 2020

鏈接：https://arxiv.xilesou.top/pdf/2002.05295.pdf

1.介紹：

事件分類是一個重要的信息抽取任務，其目的是根據事件的提及實例對事件類別進行分類。目前事件分類的主要方法是基於監督學習的方法。包括依據語義語法特徵的分類和依據深度神經網絡編碼實例特徵的分類。

監督學習中的訓練數據包括預定義的有限事件類型，以及對應的實例集合，這種方法存在明顯的弊端。當事件類型固定後模型就不可擴展，無法處理訓練數據中未出現的事件類型。而如果需要針對新的事件類型進行預測，就要重新標記數據並重新訓練模型。

事件數據的標記需要很大的成本，事實上，當前的事件抽取更類似於few-shot任務。每個實例依據少量的支撐數據作爲證據進行分類，這種方法也更接近人類的思維模式。Few-shot的具體做法就是依據帶有類別標記的支撐集作爲預測依據，典型的通過生成原型特徵向量和基於度量的分類方法對每個query選擇最合適類別進行預測。目前在事件分類領域還沒有使用few-shot方法訓練模型的先例。

但是目前的few-shot方法在訓練過程中只考慮到使用支撐集和查詢集之間的匹配關係進行訓練，這種方法是低效的。由於本身樣本的稀少這種方法不能很好的利用支撐集的信息。同時由於支撐集內部的每個實例之間存在差異，之前的方法並沒有很好的利用這些信息。

於是本文將事件分類抽象爲few-shot任務，並且在傳統的訓練方法上增加了支撐集內部的交互來提升訓練過程中支撐集數據的利用效率。並且在兩個典型的時間抽取數據集上都取得了提升。

2.方法：

首先，本文將事件分類定義爲few-shot任務：

其中數據格式如下：