命名實體識別NER

基於BiLSTM+CRF醫學病例命名實體識別項目:
中科院軟件所劉煥勇老師的中文醫學病歷NER,項目代碼

劉煥勇老師的自然語言處理項目很豐富

用深度學習做NER:

  1. 什麼是NER
  2. 文本標註工具brat
  3. 文本數據標註過程
  4. 模型訓練
  5. 模型使用

標註過程:

(brat最新的release版本只支持python2)
原始文本文件
–》 經過分句處理得到 mayun.txt
Alt
–》 經過brat標註得到 mayun.ann
Alt
–》轉化爲BIO格式,方便訓練
Alt

樣例

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章