Solr入门（一）

原創

2020-05-30 17:57

Solr入门

本文目标：了解，安装，使用

学习资料：

https://lucene.apache.org/solr/resources.html

https://lucene.apache.org/solr/guide/7_6/solr-tutorial.html

什么是Solr?

Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene.

Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest internet sites.

我做实验下载的是7.6.0版本，官网下载的。

启动和配置solr集群

以SolrCloud模式启动：./solr.cmd start -e cloud

出现了第一个交互式回话问题：要在本地集群启动几个节点？默认是2。

然后默认会使用两个端口创建节点，并且创建Solr home目录。

启动了第一个节点。

然后启动另一个节点，从日志里看到Zookeeper的信息，Solr Cloud模式默认使用ZK做Solr节点服务的注册，发现，协调。

给collection起名

看来不需要一个个解释每一步，很傻。跟着官方文档来就好了，一步一步写解释速度太慢，后面不这样写了。

创建好的数据集，有两个分片，这两个分片在每个节点上都有，分片按索引分的，索引两个分片的数据构成一个数据整体。

逻辑上每个分片有两个副本，实际在不同节点上存储。（具体见下面Gragh(Radial)展开的图更清晰）

访问http://localhost:8983/solr

选中侧边栏Gragh(Radial)能清楚的看到Solr存储的网络结构（理解这幅图很重要）：

下面这幅图，显示了分片的索引范围和所在的节点：

小结：

通过上面的步骤，使用solr cloud模式创建了两个node，一个数据集，每个node有一个shard，每个shard有两个replica。

shard的作用是索引分片，举个例子，将0-499的索引分到一个节点，将500到999的索引分到另一个节点。

replica是索引的副本，每个shard有两个副本，目的是为了故障恢复。

导入模拟数据

搜索

实验1：查询所有数据

实验2：查询关键词为foundation的数据

实验3：在实验2的基础上只查询属性id

有一个小问题，发现我导的模拟数据和官网文档不一样。查询的结果不一样。

然后后面直接记录下例子中的查询姿势吧：

http://localhost:8983/solr/techproducts/select?q=cat:electronics

查询cat关键字和electronics关键字关联的数据

http://localhost:8983/solr/techproducts/select?q=\"CAS+latency\"

查询一个由两个关键字组成的短语或者词组。因为英文分词可以按空格分词，但是现在这个需求就是想查CAS latency这个词也是可以的。

http://localhost:8983/solr/techproducts/select?q=+electronics%20-music

使用+-进行组合查询，表示包含不包含

更多关于搜索的，点击这里。

收尾：

use the bin/solr script we started out with to delete this collection:

bin/solr delete -c techproducts

And then create a new collection:

bin/solr create -c <yourCollection> -s 2 -rf 2

To stop both of the Solr nodes we started, issue the command:

bin/solr stop -all

For more information on start/stop and collection options with bin/solr, see Solr Control Script Reference.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Windows下安装配置 Solr

Windows下安裝配置 Solr Solr是一個獨立的企業級搜索應用服務器。用戶可以通過http請求，向搜索引擎服務器提交一定格式的XML文件，生成索引；也可以通過Http Get操作提出查找請求，並得到XML格式的返回結果。這

2020-07-08 10:03:35

tomcat下执行solr

設置運行環境：Context nano /etc/tomcat-6/Catalina/localhost/solr.xml Java代碼 <Context docBase= "/var/www/solr/doc/solr.war

2020-07-07 17:32:52

启动azkaban时出现User xml file conf/azkaban-users.xml doesn't exist问题解决

啓動azkaban時出現User xml file conf/azkaban-users.xml doesn’t exist問題解決　　問題詳情 [hadoop@master azkaban]$ ll total 12 dr

2020-07-04 10:10:54

Linux服务器上搭建Solr8.0及以上服务，非常详细，步步到位（包含使用Tomcat服务器）

默認的Jetty服務器啓動（很簡單） Solr服務器是一款企業級的搜索引擎，是可以支持Java連接和JSON格式等多種格式，所以作爲Java開發工程師還是需要知道的。花費了接近一天時間的配置，終於搞懂它在Linux系統上的配置。（Wind

跑龙套的程序员

2020-07-04 08:33:02

solr7.1集群部署 -图解

solr7.1集羣部署 -圖解點關注不迷路，歡迎再訪！精簡博客內容，儘量已專業術語來分享。努力做到對每一位認可自己的讀者負責。幫助別人的同時更是豐富自己的良機。目錄solr7.1集羣部署 -圖解

最初的节奏

2020-07-03 00:45:13

tomcat与solr整合的时候遇到的问题

tomcat和solr的整合，網上說了很多也很簡單，這裏不在贅述問題一、添加JDK 設置完之後要保證你添加的JDK和你用來編譯的JDK版本是一樣的：指定JDK：如果指定的JDK版本低於實際

2020-06-30 21:10:58

【linux】【solr】linux下solr开机自启动脚本，成功解决solr自启问题。

哈嘍，大家好，最近在處理solr在linux下安裝時，遇到了這麼一個問題，我們正常啓動進入到solr的bin目錄下直接solr start就直接啓動了。但如果突然有天centos7服務器重啓了，此時solr服務器也需要重啓才能使用。於是

2020-06-30 03:33:34

集成Nutch和Solr

兩年前集成Nutch 和Solr 這兩個Apache Lucene 項目組下的子項目實在是件困難的事情，需要打很多補丁(patches),爲他們的聯姻搜尋各種必需的組件(required components)。今非昔比，時下，在Solr

2020-06-29 04:40:23

lucene-全文检索的基本原理（一）

lucene-全文檢索的基本原理（一）一、總論 Lucene是一個高效的，基於Java的全文檢索庫。我們生活中的數據總體分爲兩種：結構化數據和非結構化數據。結構化數據：指具有固定格式或有限長度的數據，如數據庫，元數據等。

2020-06-21 21:38:05

全文检索基本理论（二）-solr

solr簡介一、Solr介紹 1. Solr是什麼　　基於Lucene的流行、高性能的開源企業級搜索平臺。Lucene下的子項目。官網鏈接： https://lucene.apache.org/solr 2. Solr的用途

2020-06-21 21:38:02

mac安装Solr流程

（1）首先安裝jdk，因爲Solr是基於Java的。（2）homebrew安裝Solrbrew install solr（3）查看solr安裝路徑一般默認是安裝到/usr/local/bin/solr下面的。which solr（4）啓動

乞力马扎罗的雪CYF

2020-06-21 17:19:13

mac Solr配置自签名https证书

（1）分別在mac上執行以下命令，獲得證書：keytool -genkeypair -alias solr-ssl -keyalg RSA -keysize 2048 -keypass 123456 -storepass 123456 -

乞力马扎罗的雪CYF

2020-06-21 17:19:13

solr中plugin的扩展

1. 將solr 源文件解壓，並且使用開發工具，如：Eclipse 。新建工程，並將源文件以及相關的jar 導入。 2. 在org.apache.solr.handler 包下（一般在此包下進行擴展），新建java 類。

2020-06-21 07:08:42

使用solr的addDateRangeFacet方法设置gap报错

使用solr的addDateRangeFacet方法設置gap報錯使用solr的addDateRangeFacet方法設置gap報錯使用solr的addDateRangeFacet方法設置gap報錯先看方法solrQuery.

2020-06-21 06:48:20

Solr Admin编辑数据

Solr Admin刪除數據歡迎使用Markdown編輯器1. 刪除所有2. 指定域刪除歡迎使用Markdown編輯器 1. 刪除所有 <delete> <query>*:*</query> </delete> <commit/

2020-06-21 06:48:20

24小時熱門文章

最新文章

最新評論文章