mmseg有三种模式:maxword方法,simple方法,complex方法
三种模式的区别:
1,maxword方法:尽量分解成更多的词(词长最小)
比如:“我要去中国政府工作”
分解结果: 我要, 要去, 中国, 政府, 工作
2,simple方法:简单的正向最大匹配,按照能匹配上的最长词做切分
比如:“我要去中国政府工作”
分解结果: 我要去, 中国政府, 工作
比如:“研究生命起源”
分解结果:研究生,命,起源
3,complex方法: 在上面simple的基础上,用消除歧义的规则进行过滤
比如:“研究生命起源”
分解结果:研究,生命,起源
消除歧义的规则介绍参照:
https://blog.csdn.net/daniel_ustc/article/details/50488040