在python這pymmseg-cpp 還是十分方便的!
環境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 tar -zxf pymmseg-cpp*.tar.gz //解壓後得到pymmseg 目錄
cd pymmseg\mmseg-cpp
python build.py #生成 mmseg.so文件
3 將 pymmseg 目錄複製到 /usr/local/lib/python2.6/dist-packages 中
4 測試有沒有成功:
test.py
代碼:
from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天氣真好啊,我們一起出去玩一下吧'
algor = mmseg.Algorithm(text)
for tok in algor:
print '%s [%d..%d]' % (tok.text, tok.start, tok.end)