原创 Lucence入門實例

package org.test.lucence; import java.io.File; import java.io.FileReader; import java.io.IOException;

原创 spark集羣安裝部署(spark on yarn)

spark集羣安裝部署(spark on yarn) 1.前提 已經部署了Hadoop 2.2集羣 2.下載並安裝scala 2.1下載scala http://www.scala-lang.org/download/ 2.2安裝

原创 增加elasticsearch-head

增加elasticsearch-head 1.下載 https://github.com/mobz/elasticsearch-head 2.安裝 2.1以插件的形式安裝     %ES_HOME%/bin/plugin -in

原创 Lucence自定義分詞器

package org.lucene.util; import java.io.Reader; import java.util.Set; import org.apache.lucene.analysi

原创 SolrCloud架構整理

1.核心概念      Collection:在SolrCloud集羣中邏輯意義上的完整的索引。它常常被劃分爲一個或多個Shard,它們使用相同的Config Set。如果Shard數超過一個,它就是分佈式索引,SolrCloud讓

原创 輸出Lucence的分詞信息

package org.lucene.util; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Ana

原创 Lucence自定義評分查詢

package org.adv.lucene.util; import java.io.IOException; import java.text.SimpleDateFormat; import jav

原创 Lucence的各種查詢

package org.adv.lucene.util; import java.io.IOException; import java.text.SimpleDateFormat; import jav

原创 Lucence自定義查詢解析器

package org.adv.lucene.util; import java.text.SimpleDateFormat; import java.util.regex.Pattern; import

原创 Spark架構圖

Spark架構圖

原创 爲elastic添加中文分詞

添加中文分詞 可以直接使用配置好的es中文版:https://github.com/medcl/elasticsearch-rtf 可以可以自己集成中文分詞組件,medcl爲es寫了三個中文分詞插件,一個是ik的,一個是mmseg的,一個

原创 elastic客戶端開發

es客戶端開發 1.將%ES_HOME%/lib目錄下的jar包加入到項目的CLASSPATH中 2.代碼實例 package org.test.es; import java.io.IOException; import jav

原创 elasticsearch集羣的部署

elasticsearch集羣的部署 1.部署4個節點的elasticsearch 10.41.2.84     es2 10.41.2.85     es3 10.41.2.86     es4 2.集羣配置 2.1配置10.41.

原创 Lucence搜索實例

package org.test.searcher; import java.io.File; import java.io.IOException; import java.text.ParseExce

原创 基於Lucence的同義詞分詞器

package org.lucene.util; import java.io.Reader; import org.apache.lucene.analysis.Analyzer; import org