NER-序列标注

命名实体识别-序列标注

标签类型

进行命名实体识别时,通常对每个字进行标注。中文为单个字,英文为单词,空格分割。
标签类型一般如下:

类型 说明
B Begin,代表实体片段的开始
I Internediate,代表实体片段的中间
E End,代表实体片段的结束
S Single,代表实体片段为单个字
O Other,代表字符不为任何实体

标注类型

这里介绍比较常用的几种标注方式
BIO:标识实体的开始,中间部分和非实体部分
BIOS:增加S单个实体情况的标注
BIOSE:增加E实体的结束标识

标注demo

BIO标注&&BIOSE标注

BIO标注 BIO标注
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章