搜索已經火了好久了,今天簡單瞭解了一下關於搜索相關的東西。
外面有不少成熟的搜索引擎:Lucene、Xapian和Sphinx等。
Lucene是Java的標準搜索引擎,也是Apache的頂級項目之一,相關介紹:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1005E,車東的介紹:http://www.chedong.com/tech/lucene.html。它的官網:http://lucene.apache.org/。
它也有Python的庫,PyLucene,相關試用手記:http://www.cnblogs.com/unfish/archive/2006/10/25/539956.html。貌似安裝和使用上有一些細節,這個等試用後再補充進來。
Xapin是C++開發的,官網:http://www.xapian.org/。
關於Xapian和Sphinx的測試比較文章:http://www.letrails.cn/archives/xapian-vs-sphinx-in-rails