Event Detection with Trigger-Aware Lattice Neural Network(論文解讀)

本文針對事件抽取任務中的觸發詞識別和觸發詞分類子任務提出了可以充分利用字級別和詞級別語義信息的模型Trigger-Aware Lattice Neural Network(TLNN),在ACE2005和KBP2017數據集上取得了state-of-art的效果。本文收錄在EMNLP2019
源碼:github 原文:原文鏈接

缺少自然分隔符的語言(如中文)在事件抽取任務上存在以下問題:
① 基於詞(word)的方法易造成觸發詞的錯誤匹配/識別(Trigger Identification),原因在於預處理階段的分詞錯誤。
② 觸發詞的多義性會導致觸發詞的分類(Trigger Classfication)錯誤。
解決方法:
本文提出的TLNN框架動態融合字(character)與詞(word)的信息以緩解問題①
通過添加外部語言知識庫(HowNet)增強對多義觸發詞的理解以緩解問題②
TLNN框架:
在這裏插入圖片描述
基於觸發詞感知的特徵提取器架構(Trigger-Aware Feature Extractor):
在這裏插入圖片描述
爲了緩解觸發詞的錯誤匹配問題,創建一個path鏈接某個詞開始和結束位置之間所有詞的單元狀態(cell state)。
該模型分爲三個階段的處理流程:
1) 預處理模塊:使用Skip-Gram模型將句子序列S={c1,c2,…,cN}轉化爲字級別和詞級別的向量。同時,基於HowNet得到所有的與該句子序列中有關的字和詞的註釋信息向量(sense-level embedding)。
2) 特徵提取模塊
使用觸發詞感知的網格LSTM(Trigger-aware lattice LSTM)作爲特徵提取器,它可以同時提取character-level、 word-level、sense-level(使用HowNet對多義詞的註釋)的信息。
3) 序列標註模塊
採用BIO標註方式,使用CRF預測序列的標註結果,並獲得序列標註的loss。
實驗:
本文在ACE2005和KBP2017數據集上分別進行了觸發詞識別和觸發詞分類的實驗。文中實驗對比基於字和基於詞的觸發詞識別和觸發詞分類任務時均取得較好的效果。
在這裏插入圖片描述
總結:
本文提出一個事件抽取模型TLNN,該模型可以有效緩解觸發詞錯誤匹配和一詞多義的觸發詞問題,藉助多個粒度的語義特徵表示(字級別、詞級別、字/詞釋義級別)和
基於觸發詞感知的特徵提取器捕獲多個層級的語義信息,得到了較好的實驗效果。

補充

Lattice LSTM 結構
在這裏插入圖片描述
該模型對輸入字符序列和所有匹配詞典的潛在詞彙進行編碼。與基於字符的方法相比,該模型顯性地利用詞和詞序信息。與基於詞的方法相比,lattice LSTM不會出現分詞錯誤。門控循環單元使得模型能夠從句子中選擇最相關的字符和詞,以生成更好的效果。

關注我的微信公衆號,一起變強!
在這裏插入圖片描述

參考:
【1】**Lattice LSTM介紹:**https://baijiahao.baidu.com/s?id=1604786068701856320&wfr=spider&for=pc
【2】Yue Zhang、Jie Yang .2018 Chinese NER Using Lattice LSTM原文鏈接

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章