命名实体识别NER

基于BiLSTM+CRF医学病例命名实体识别项目:
中科院软件所刘焕勇老师的中文医学病历NER,项目代码

刘焕勇老师的自然语言处理项目很丰富

用深度学习做NER:

  1. 什么是NER
  2. 文本标注工具brat
  3. 文本数据标注过程
  4. 模型训练
  5. 模型使用

标注过程:

(brat最新的release版本只支持python2)
原始文本文件
–》 经过分句处理得到 mayun.txt
Alt
–》 经过brat标注得到 mayun.ann
Alt
–》转化为BIO格式,方便训练
Alt

样例

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章