推薦FudanNLP,這是一個復旦大學計算機學院開發的開源中文自然語言處理(NLP)工具包
Fudan NLP裏包含中文分詞、關鍵詞抽取、命名實體識別、詞性標註、時間詞抽取、語法分析等功能,對搜索引擎、文本分析等極爲有價值。
svn checkout http://fudannlp.googlecode.com/svn/trunk/fudannlp-read-only
軟件包下載地址:
http://code.google.com/p/fudannlp/downloads/list
系統截圖如下,分詞和抽取的效果很不錯