jieba(結巴)Python分詞器加載到Eclipse方法

參考:http://www.oschina.net/p/jieba/news

一、結巴的安裝

Python 2.x 下的安裝

  • 全自動安裝:easy_install jieba 或者 pip install jieba

  • 半自動安裝:先下載http://pypi.python.org/pypi/jieba/ ,解壓後運行python setup.py install

  • 手動安裝:將jieba目錄放置於當前目錄或者site-packages目錄

  • 通過import jieba 來引用 (第一次import時需要構建Trie樹,需要幾秒時間)

Python 3.x 下的安裝

  • 目前master分支是隻支持Python2.x 的

  • Python3.x 版本的分支也已經基本可用: https://github.com/fxsjy/jieba/tree/jieba3k

    git clone https://github.com/fxsjy/jieba.git
    git checkout jieba3k
    python setup.py install

安裝完畢後,在命令行中測試,

#encoding=utf-8
import jieba

seg_list = jieba.cut("我來到北京清華大學",cut_all=True)
print "Full Mode:", "/ ".join(seg_list) #全模式

seg_list = jieba.cut("我來到北京清華大學",cut_all=False)
print "Default Mode:", "/ ".join(seg_list) #精確模式

seg_list = jieba.cut("他來到了網易杭研大廈") #默認是精確模式
print ", ".join(seg_list)

seg_list = jieba.cut_for_search("小明碩士畢業於中國科學院計算所,後在日本京都大學深造") #搜索引擎模式
print ", ".join(seg_list)

看是否安裝成功。

二、Eclipse的配置

以上安裝完以後再Eclipse中輸入上述命令顯示jieba不存在,點擊window->Preference->PyDev->Eidtor->interpreter-Python

選擇下面的Libraries,選擇New Folder,將結巴的安裝目錄加入即可,在linux下使用easy_install一般安裝在/usr/local/lib/Python2.7/dist-packages/jieba-0.31-py2.7.egg

點擊確定就可以在Eclipse中使用了,enjoying it!

發佈了10 篇原創文章 · 獲贊 21 · 訪問量 14萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章