jieba分爲好幾種模式
我們可以去看下github
github jieba
我們簡單的測試一下
import jieba
seg_list = jieba.cut("我來到北京清華大學", cut_all=True)
print("全模式: " + "/ ".join(seg_list)) # 全模式
seg_list = jieba.cut("我來到北京清華大學", cut_all=False)
print("精準模式: " + "/ ".join(seg_list)) # 精確模式
seg_list = jieba.cut("他來到了網易杭研大廈") # 默認是精確模式
print(", ".join(seg_list))
seg_list = jieba.cut_for_search("小明碩士畢業於中國科學院計算所,後在日本京都大學深造") # 搜索引擎模式
print(", ".join(seg_list))
seg_list = jieba.analyse.extract_tags("小明碩士畢業於中國科學院計算所,後在日本京都大學深造") #基於 TF-IDF 算法的關鍵詞抽取
print(", ".join(seg_list))