Lucene學習筆記(3)(竹筍炒肉)

Lucene學習筆記(3)

lucene_green_100.gif  繼續學習車東利用Lucene提供網站全文檢索的開源項目。

  由於文檔不全,這次看代碼看得很苦,幾乎是用log4j一個類一個方法的看過來的。令人高興的是,期間請教車東時,他說到要重新整理一下整個項目的源代碼和文檔,估計後來者可以輕鬆矣。

  除了以前提到的漢化外,車東在這個項目中,加入了很多實用的東東,如反顯、排序、摘要等,甚至網頁過期時間、輸出格式的限制都考慮到了。

  下面是我的測試頁面,大家看看先。等明天我把源代碼diff一下,把我做的修改文件也掛上來,供大家參考。

webluecenesform.gif

webluecenesres.gif

  在車東的簡歷上,有一個商業檢索網址,估計是車東他們的成績,可以去看看,也幫助理解這個項目的功能。
  下面是運行weblucene需要作得改動和說明。

weblucene/
|-- WEB-INF
|   |-- classes
|   |   `-- com
|   |       `-- chedong
|   |           |-- weblucene
|   |               |-- WebLuceneAdminServlet.java
|   |               |-- index
|   |               |   `-- SAXIndexer.java
|   |               `-- search
|   |                   `-- WebLuceneHighlighter.java
|   |-- logs <-----這是一個子目錄,手工建立後程序運行時log文件在這個目錄下。
|   `-- var
|       `-- app
|           |-- index <-----這是一個子目錄,手工建立後索引時將索引文件放在這兒
|           |-- weblucene.xsl
|           `-- wl.conf
|-- index.html
|-- style.css
`-- test.xml

對SAXIndexer.java的修改
將兩行
sb.append(luceneDoc.getField((String) it.next()));
改爲兩行
sb.append(luceneDoc.get((String) it.next()));

對WebLuceneHighlighter.java的修改
將兩處<u>改爲<ins>
將兩處</u>改爲</ins>

對WebLuceneAdminServlet.java可改可不改
建議將
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
                          + logFileName;
改爲
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
                          + "/" + logFileName;
                          


除了三個java程序外,其它文件都可以從這兒下載.

  通過web進行檢索前,需要先建立索引,命令如下:

$ java IndexRunner -i tt.xml -o WEB-INF/var/app/index/ -t Title,Content -n Author,Pubtime

  需要再說一句,就是估計車東會很快推出一個嶄新的實用性更強的版本,到那時此處可供下載的內容估計都沒有用了。:)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章