lucene 简单的例子

使用lucene-core-3.1.0.jar

一 创建索引

  1. public class Indexer {  
  2.     public static void main(String[] args) throws IOException {  
  3.         // 保存索引文件的地方  
  4.         String indexDir = "F://indexDir";  
  5.         // 将要搜索TXT文件的地方  
  6.         String dateDir = "F://dateDir";  
  7.         IndexWriter indexWriter = null;  
  8.         // 创建Directory对象  
  9.         Directory dir = new SimpleFSDirectory(new File(indexDir));  
  10.         // 创建IndexWriter对象,第一个参数是Directory,第二个是分词器,第三个表示是否是创建,如果为false为在此基础上面修改,第四表示表示分词的最大值,比如说new  
  11.         // MaxFieldLength(2),就表示两个字一分,一般用IndexWriter.MaxFieldLength.LIMITED  
  12.         indexWriter = new IndexWriter(dir, new StandardAnalyzer(  
  13.                 Version.LUCENE_30), true, IndexWriter.MaxFieldLength.UNLIMITED);  
  14.         File[] files = new File(dateDir).listFiles();  
  15.         for (int i = 0; i < files.length; i++) {  
  16.             Document doc = new Document();  
  17.             // 创建Field对象,并放入doc对象中  
  18.             doc.add(new Field("contents"new FileReader(files[i])));  
  19.             doc.add(new Field("filename", files[i].getName(), Field.Store.YES,  
  20.                     Field.Index.NOT_ANALYZED));  
  21.             doc.add(new Field("indexDate", DateTools.dateToString(new Date(),  
  22.                     DateTools.Resolution.DAY), Field.Store.YES,  
  23.                     Field.Index.NOT_ANALYZED));  
  24.             // 写入IndexWriter  
  25.             indexWriter.addDocument(doc);  
  26.         }  
  27.         // 查看IndexWriter里面有多少个索引  
  28.         System.out.println("numDocs/t" + indexWriter.numDocs());  
  29.         indexWriter.close();  
  30.     }  
  31. }  

2 索引文件

  1. public class Seacher {  
  2.     public static void main(String[] args) throws IOException, ParseException {  
  3.         // 保存索引文件的地方  
  4.         String indexDir = "F://indexDir";  
  5.         Directory dir = new SimpleFSDirectory(new File(indexDir));  
  6.         // 创建 IndexSearcher对象,相比IndexWriter对象,这个参数就要提供一个索引的目录就行了  
  7.         IndexSearcher indexSearch = new IndexSearcher(dir);  
  8.         // 创建QueryParser对象,第一个参数表示Lucene的版本,第二个表示搜索Field的字段,第三个表示搜索使用分词器  
  9.         QueryParser queryParser = new QueryParser(Version.LUCENE_30,  
  10.                 "contents"new StandardAnalyzer(Version.LUCENE_30));  
  11.         // 生成Query对象  
  12.         Query query = queryParser.parse("pause");  
  13.         // 搜索结果 TopDocs里面有scoreDocs[]数组,里面保存着索引值  
  14.         TopDocs hits = indexSearch.search(query, 3);  
  15.         // hits.totalHits表示一共搜到多少个  
  16.         System.out.println("找到了" + hits.totalHits + "个");  
  17.         // 循环hits.scoreDocs数据,并使用indexSearch.doc方法把Document还原,再拿出对应的字段的值  
  18.         for (int i = 0; i < hits.scoreDocs.length; i++) {  
  19.             ScoreDoc sdoc = hits.scoreDocs[i];  
  20.             Document doc = indexSearch.doc(sdoc.doc);  
  21.             System.out.println(doc.get("filename") + "/t"  
  22.                     + hits.scoreDocs[i].score);  
  23.         }  
  24.         indexSearch.close();  
  25.     }  
  26. }  

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章