用於嵌套命名實體識別的多層神經網絡模型[NAACL 2018]閱讀筆記

論文題目:A Neural Layered Model for Nested Named Entity Recognition
論文出處:NAACL 2018
論文地址:https://www.aclweb.org/anthology/N18-1131

論文概要

相比於傳統的單層級的NER任務(flat NER),在實際業務中會出現實體嵌套的情況,對應爲嵌套NER任務(nested NER)。
下圖是一個嵌套實體的實例:
在這裏插入圖片描述
這篇論文給出了一種可以實現嵌套實體識別的end to end 的解決方案。

模型pipeline

首先直接附上模型結構圖:
在這裏插入圖片描述
模型結構很清晰,自底向上,從細粒度實體識別到粗粒度實體識別。每一層級的NER模型都是經典的bilstm+CRF。

這裏簡要記錄下具體實現的幾個細節:

  1. word representation
    在這裏插入圖片描述
    基於lstm提取字符表示後與詞向量進行級聯,得到最終的單詞表示。

2.layerd NER
在這裏插入圖片描述
具體堆疊NER的實現細節,對於底層NER層識別出的實體,對實體內的特徵向量求平均後作爲下一層NER的輸入,也就是將上一層識別出的實體作爲一個token,一個整體來看待。如果上一層沒有識別出實體(也就是‘O’標籤),則直接將其特徵向量輸出作爲下一層的輸入。
對最底層來講,特徵向量就是上文提到的級聯後的word representation,對後面的NER來說,特徵向量是上一層LSTM的輸出,如模型結構圖所示。

實驗結果

評測數據集:
在這裏插入圖片描述
實驗結果:
這裏不詳細記錄了,詳見論文。

論文總結

  1. 論文提供了進行嵌套NER識別的端到端的解決方案。
  2. 論文針對的是從inside 到 outside的識別方案,即先識別細粒度實體,再識別粗粒度實體。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章