原创 Lucene 3.0 分詞 IKAnalyzer

最近lucene已經更新到lucene 3.0版本了 2.X版本的一些用法已經徹底不在支持了。下面的例子主要是介紹中文分詞器IKAnalyzer的使用

原创 Lucene Payload 的研究與應用

http://www.ibm.com/developerworks/cn/opensource/os-cn-lucene-pl/index.html2

原创 university 4/n (45)

chapter?Vocabulary use in classroomteaching and textbooks?.?IntroductionThe

原创 helios 的 uml2 工具要從macket place下載

helios 的 uml2 工具要從macket place下載,eclipse網站的還不支持3.6 符上官方FAQ,跟着以下步驟讓eclipse 3.6支持uml2 tools How do I workaround org.ecl

原创 university 2/n

Chapter 1.Introductionof register,and register is the‘expression-plane’of g

原创 university 1/n

chapter?Introduction?.?The student perspective:Language in the universitySt

原创 attributesource

package org.apache.lucene.util;/** * Licensed to the Apache Software Founda

原创 走一路,又見豔陽天:《Lucene原理與代碼分析完整版》

2010年這本書終於完稿,向大蝦forfuture1978(http://forfuture1978.iteye.com)表示如濤濤洪水般的敬意。裏面

原创 [zz]學習lucene應該多看源代碼

最近在爲星網將要上線的商城系統開發搜索功能,要求使用lucene和數據庫。由於lucene是完全開源的,所以對於學習與使用lucene的人,這麼好的源

原创 university 3/n

Chapter 1.Introductiondiagnostic tools for the evaluation of exam prompts,u

原创 standford vs opennlp

重新訓練的模型主要針對短角色,即詞串數不大於3的角色,這是因爲考慮到在實際環境下一般人難以輸入長句,一般口語化的句子其實都比較短。手工測試訓練後的效果

原创 基於P2P的Web搜索強於集中式搜索引擎?

   搜索引擎已經成爲一種重要的網絡信息導航工具,它幫助人們在海量 Web 數據中快速方便地找到所需信息.隨着 Web數據量的持續快速增長,傳統集中式搜索引擎已經越來越不能滿足人們不斷增長的信息獲取需求.一方面,集中式搜索引擎的服務器處理

原创 msyql的select語法

13.2.7. SELECT語法13.2.7.1. JOIN語法13.2.7.2. UNION語法SELECT [ALL | DISTINCT

原创 改寫lucene的Analyzer,添加自己的中文分詞系統的方法

/***作者:奪天策 百度空間名:剎那劍欣*轉載請說明出處! */ 這幾天完成了我的中文分詞算法,就着手把它加入到lucene中去

原创 standardtokenizer

/** * Licensed to the Apache Software Foundation (ASF) under one or more *