jieba分詞簡單實例

jieba分爲好幾種模式
我們可以去看下github
github jieba
我們簡單的測試一下

import jieba

seg_list = jieba.cut("我來到北京清華大學", cut_all=True)
print("全模式: " + "/ ".join(seg_list))  # 全模式

seg_list = jieba.cut("我來到北京清華大學", cut_all=False)
print("精準模式: " + "/ ".join(seg_list))  # 精確模式

seg_list = jieba.cut("他來到了網易杭研大廈")  # 默認是精確模式
print(", ".join(seg_list))

seg_list = jieba.cut_for_search("小明碩士畢業於中國科學院計算所,後在日本京都大學深造")  # 搜索引擎模式
print(", ".join(seg_list))

seg_list = jieba.analyse.extract_tags("小明碩士畢業於中國科學院計算所,後在日本京都大學深造")  #基於 TF-IDF 算法的關鍵詞抽取
print(", ".join(seg_list))

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章