BMES => B:词语开始、M:词语中间、E:词语结束、S:单独成词
并非所有中文任务都需要分词
语料库
- 每行是一篇“文章”
- 每篇文章用空格分开
- 语料库的准确性,严重影响分词结果
- 理论上,语料库越大越好
每个字都有一个标识(隐藏状态),可以根据语料库得到所有标识
中文分词就是为了得到状态
麻 | 辣 | 肥 | 牛 | 真 | 好 | 吃 | ! |
---|---|---|---|---|---|---|---|
B | M | M | E | S | B | E | S |
根据已知状态进行分词,即在"E"和"S"后面输出空格即可
将已分好的词 得到 每个字的状态
BMES => B:词语开始、M:词语中间、E:词语结束、S:单独成词
并非所有中文任务都需要分词
语料库
每个字都有一个标识(隐藏状态),可以根据语料库得到所有标识
中文分词就是为了得到状态
麻 | 辣 | 肥 | 牛 | 真 | 好 | 吃 | ! |
---|---|---|---|---|---|---|---|
B | M | M | E | S | B | E | S |
根据已知状态进行分词,即在"E"和"S"后面输出空格即可
将已分好的词 得到 每个字的状态
一. 二. 三. ! 作 者 : Yaopengfei(姚鵬飛) 博客地址 : http://www.cnblogs.com
Windows 允許空密碼遠程桌面 開啓遠程 修改策略 輸入命令 secpol.msc 本地策略 -> 安全選項 -> 帳戶:使用空密碼的本地帳戶只允許進行控制檯登錄