原创 Configuring Solr 1.4 logging with Log4J in Tomcat

Solr 1.4 logging is based on the “SLF4J” API . To configure Solr to use Log4J as standard logging implementation depl

原创 Tomcat啓動分析

  Tomcat筆記(1)   Tomcat啓動分析 heavyz, 2003-03-22 1 - Tomcat Server的組成部分 1.1 - Server A Server element represents t

原创 solr 索引mysql DIH 鏈接

Download the JDBC Driver Download the JDBC Driver for MySQL from http://mysql.spd.co.il/Downloads/Connector-J/mysql-con

原创 katta文檔

katta文檔 http://katta.sourceforge.net/documentation/how-katta-works     Lucene另一種分佈式搜索是使用Solr (本人 不太熟悉Solr)。所有的更新是在Solr

原创 SolrRelevancyFAQ --排序

  Search:   Solr Relevancy FAQ Relevancy is the quality of results returned from a query, encompassing both w

原创 linux 下 screen 使用方法

經常需要遠程登錄到Linux服務器?你是不是經常爲一些長時間運行的任務頭疼?還在用 nohup 嗎?那麼來看看 screen 吧,它會給你一個驚喜! 首先,安裝screen wget http://ftp.gnu.org/gnu/sc

原创 solr dismax

http://wiki.apache.org/solr/SolrQuerySyntax Please note that many characters in the Solr Query Syntax (most notable t

原创 unix設置master和slaver之間無密碼訪問 ssh

3臺機器系統都爲asiaunx : master(192.168.0.210) slave1(192.168.0.211) slave2(192.168.0.212) 1、分別設置master/slaver1/slaver2的主機名,

原创 Bloom-Filter算法

一、 Bloom-Filter算法簡介。 Bloom-Filter,即布隆過濾 器,1970年由Bloom中提出。它可以用於檢索一個元素是否在一個集合中,其優點是空間效率和查詢時間都遠遠超過其他算法,其不足在於Bloom-

原创 solr1.4 安裝部署

開始配置: 1 、安裝tomcat 2 、將下載的solr 包下面的dist 文件夾中的apache-solr-1.4.1.war 拷貝到 tomcat 的webapps 並且改名爲 solr.war 一般情況下會自動

原创 轉 髒字/ 敏感詞彙搜索算法

字符串 多模式精確匹配(髒字/敏感詞彙/關鍵字過濾算法)——TTMP算法 之實戰F模式   字符串 多模式精確匹配(髒字/敏感詞彙搜索算法)——TTMP算法 之B模式概述 字符串 多模式精確匹配(髒字/敏感詞彙搜索算法) 之

原创 Mahout

http://lucene.apache.org/mahout/ 基於 Apache Mahout 構建社會化推薦引擎 http://www.ibm.com/developerworks/cn/java/j-lo-mahout/

原创 lucene 處理大規模數據的一些解決方法 katta--簡介

lucene 索引文件有大概10G,搜索時候比較慢,最好拆分存放索引,多位置同時搜索 當數據量較大訪問量較大的時候,分佈式就不可避免,處理方式有下面幾種: 1,用一個好服務器作爲索引服務器,磁盤冗餘的方式保證搜索的正常進行; 2

原创 solr DataImportHandler

大多數的應用程序將數據存儲在關係數據庫、xml文件中。對這樣的數據進行搜索是很常見的應用。所謂的DataImportHandler提供一種可配置 的方式向solr導入數據,可以一次全部導入,也可以增量導入。       概覽  

原创 敏感詞過濾算法

字符串 多模式精確匹配(髒字/敏感詞彙/關鍵字過濾算法)——TTMP算法 之實戰F模式   字符串 多模式精確匹配(髒字/敏感詞彙搜索算法)——TTMP算法 之B模式概述 字符串 多模式精確匹配(髒字/敏感詞彙搜索算法)