基於BiLSTM+CRF醫學病例命名實體識別項目:
中科院軟件所劉煥勇老師的中文醫學病歷NER,項目代碼
劉煥勇老師的自然語言處理項目很豐富
用深度學習做NER:
標註過程:
(brat最新的release版本只支持python2)
原始文本文件
–》 經過分句處理得到 mayun.txt
–》 經過brat標註得到 mayun.ann
–》轉化爲BIO格式,方便訓練
基於BiLSTM+CRF醫學病例命名實體識別項目:
中科院軟件所劉煥勇老師的中文醫學病歷NER,項目代碼
劉煥勇老師的自然語言處理項目很豐富
(brat最新的release版本只支持python2)
原始文本文件
–》 經過分句處理得到 mayun.txt
–》 經過brat標註得到 mayun.ann
–》轉化爲BIO格式,方便訓練