在做搜索員工的服務時,用戶會輸出英文名和工號,例如emma0012,這個時候使用jiaba分詞不能把名字和工號分開,不能匹配不同的字段,所以在分詞後使用分組函數特殊處理一下
from itertools import groupby
word = 'emma0012haha'
for k, g in groupby(word, key=lambda x: x.isdigit()):
words.append(''.join(list(g)))
最後得到['emma','0012','haha']