用於嵌套命名實體識別的多層神經網絡模型[NAACL 2018]閱讀筆記

論文題目：A Neural Layered Model for Nested Named Entity Recognition
論文出處：NAACL 2018
論文地址：https://www.aclweb.org/anthology/N18-1131

論文概要

相比於傳統的單層級的NER任務（flat NER），在實際業務中會出現實體嵌套的情況，對應爲嵌套NER任務（nested NER）。
下圖是一個嵌套實體的實例：

這篇論文給出了一種可以實現嵌套實體識別的end to end 的解決方案。

模型pipeline

首先直接附上模型結構圖：

模型結構很清晰，自底向上，從細粒度實體識別到粗粒度實體識別。每一層級的NER模型都是經典的bilstm+CRF。

這裏簡要記錄下具體實現的幾個細節：

word representation

基於lstm提取字符表示後與詞向量進行級聯，得到最終的單詞表示。

2.layerd NER

具體堆疊NER的實現細節，對於底層NER層識別出的實體，對實體內的特徵向量求平均後作爲下一層NER的輸入，也就是將上一層識別出的實體作爲一個token，一個整體來看待。如果上一層沒有識別出實體（也就是‘O’標籤），則直接將其特徵向量輸出作爲下一層的輸入。
對最底層來講，特徵向量就是上文提到的級聯後的word representation，對後面的NER來說，特徵向量是上一層LSTM的輸出，如模型結構圖所示。

實驗結果

評測數據集：

實驗結果：
這裏不詳細記錄了，詳見論文。

論文總結

論文提供了進行嵌套NER識別的端到端的解決方案。
論文針對的是從inside 到 outside的識別方案，即先識別細粒度實體，再識別粗粒度實體。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

用於嵌套命名實體識別的多層神經網絡模型[NAACL 2018]閱讀筆記

論文概要

模型pipeline

實驗結果

論文總結

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

CS224n(2019):Assignment2 參考答案

linux系統三步解決matplotlib圖片中文顯示問題

Leetcode-695.最大島嶼面積（DFS 與 BFS 解法，python3）

從零開始實現核密度估計（kernel density estimation，KDE）-python實現

linux磁盤掛載教程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結