Lucene學習筆記(3)
由於文檔不全,這次看代碼看得很苦,幾乎是用log4j一個類一個方法的看過來的。令人高興的是,期間請教車東時,他說到要重新整理一下整個項目的源代碼和文檔,估計後來者可以輕鬆矣。
除了以前提到的漢化外,車東在這個項目中,加入了很多實用的東東,如反顯、排序、摘要等,甚至也連網頁過期時間、輸出格式的限制都考慮到了。
下面是我的測試頁面,大家看看先。等明天我把源代碼diff一下,把我做的修改文件也掛上來,供大家參考。
在車東的簡歷上,有一個商業檢索網址,估計是車東他們的成績,可以去看看,也幫助理解這個項目的功能。
下面是運行weblucene需要作得改動和說明。
|-- WEB-INF
| |-- classes
| | `-- com
| | `-- chedong
| | |-- weblucene
| | |-- WebLuceneAdminServlet.java
| | |-- index
| | | `-- SAXIndexer.java
| | `-- search
| | `-- WebLuceneHighlighter.java
| |-- logs <-----這是一個子目錄,手工建立後程序運行時log文件在這個目錄下。
| `-- var
| `-- app
| |-- index <-----這是一個子目錄,手工建立後索引時將索引文件放在這兒。
| |-- weblucene.xsl
| `-- wl.conf
|-- index.html
|-- style.css
`-- test.xml
對SAXIndexer.java的修改
將兩行
sb.append(luceneDoc.getField((String) it.next()));
改爲兩行
sb.append(luceneDoc.get((String) it.next()));
對WebLuceneHighlighter.java的修改
將兩處<u>改爲<ins>
將兩處</u>改爲</ins>
對WebLuceneAdminServlet.java可改可不改
建議將
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
+ logFileName;
改爲
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
+ "/" + logFileName;
除了三個java程序外,其它文件都可以從這兒下載.
通過web進行檢索前,需要先建立索引,命令如下:
需要再說一句,就是估計車東會很快推出一個嶄新的實用性更強的版本,到那時此處可供下載的內容估計都沒有用了。:)