Solr入門（一）

原創

2020-05-30 17:57

Solr入門

本文目標：瞭解，安裝，使用

學習資料：

https://lucene.apache.org/solr/resources.html

https://lucene.apache.org/solr/guide/7_6/solr-tutorial.html

什麼是Solr?

Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene.

Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest internet sites.

我做實驗下載的是7.6.0版本，官網下載的。

啓動和配置solr集羣

以SolrCloud模式啓動：./solr.cmd start -e cloud

出現了第一個交互式回話問題：要在本地集羣啓動幾個節點？默認是2。

然後默認會使用兩個端口創建節點，並且創建Solr home目錄。

啓動了第一個節點。

然後啓動另一個節點，從日誌裏看到Zookeeper的信息，Solr Cloud模式默認使用ZK做Solr節點服務的註冊，發現，協調。

給collection起名

看來不需要一個個解釋每一步，很傻。跟着官方文檔來就好了，一步一步寫解釋速度太慢，後面不這樣寫了。

創建好的數據集，有兩個分片，這兩個分片在每個節點上都有，分片按索引分的，索引兩個分片的數據構成一個數據整體。

邏輯上每個分片有兩個副本，實際在不同節點上存儲。（具體見下面Gragh(Radial)展開的圖更清晰）

訪問http://localhost:8983/solr

選中側邊欄Gragh(Radial)能清楚的看到Solr存儲的網絡結構（理解這幅圖很重要）：

下面這幅圖，顯示了分片的索引範圍和所在的節點：

小結：

通過上面的步驟，使用solr cloud模式創建了兩個node，一個數據集，每個node有一個shard，每個shard有兩個replica。

shard的作用是索引分片，舉個例子，將0-499的索引分到一個節點，將500到999的索引分到另一個節點。

replica是索引的副本，每個shard有兩個副本，目的是爲了故障恢復。

導入模擬數據

搜索

實驗1：查詢所有數據

實驗2：查詢關鍵詞爲foundation的數據

實驗3：在實驗2的基礎上只查詢屬性id

有一個小問題，發現我導的模擬數據和官網文檔不一樣。查詢的結果不一樣。

然後後面直接記錄下例子中的查詢姿勢吧：

http://localhost:8983/solr/techproducts/select?q=cat:electronics

查詢cat關鍵字和electronics關鍵字關聯的數據

http://localhost:8983/solr/techproducts/select?q=\"CAS+latency\"

查詢一個由兩個關鍵字組成的短語或者詞組。因爲英文分詞可以按空格分詞，但是現在這個需求就是想查CAS latency這個詞也是可以的。

http://localhost:8983/solr/techproducts/select?q=+electronics%20-music

使用+-進行組合查詢，表示包含不包含

更多關於搜索的，點擊這裏。

收尾：

use the bin/solr script we started out with to delete this collection:

bin/solr delete -c techproducts

And then create a new collection:

bin/solr create -c <yourCollection> -s 2 -rf 2

To stop both of the Solr nodes we started, issue the command:

bin/solr stop -all

For more information on start/stop and collection options with bin/solr, see Solr Control Script Reference.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Windows下安裝配置 Solr

Windows下安裝配置 Solr Solr是一個獨立的企業級搜索應用服務器。用戶可以通過http請求，向搜索引擎服務器提交一定格式的XML文件，生成索引；也可以通過Http Get操作提出查找請求，並得到XML格式的返回結果。這

2020-07-08 10:03:35

tomcat下執行solr

設置運行環境：Context nano /etc/tomcat-6/Catalina/localhost/solr.xml Java代碼 <Context docBase= "/var/www/solr/doc/solr.war

2020-07-07 17:32:52

啓動azkaban時出現User xml file conf/azkaban-users.xml doesn't exist問題解決

啓動azkaban時出現User xml file conf/azkaban-users.xml doesn’t exist問題解決　　問題詳情 [hadoop@master azkaban]$ ll total 12 dr

2020-07-04 10:10:54

Linux服務器上搭建Solr8.0及以上服務，非常詳細，步步到位（包含使用Tomcat服務器）

默認的Jetty服務器啓動（很簡單） Solr服務器是一款企業級的搜索引擎，是可以支持Java連接和JSON格式等多種格式，所以作爲Java開發工程師還是需要知道的。花費了接近一天時間的配置，終於搞懂它在Linux系統上的配置。（Wind

跑龙套的程序员

2020-07-04 08:33:02

solr7.1集羣部署 -圖解

solr7.1集羣部署 -圖解點關注不迷路，歡迎再訪！精簡博客內容，儘量已專業術語來分享。努力做到對每一位認可自己的讀者負責。幫助別人的同時更是豐富自己的良機。目錄solr7.1集羣部署 -圖解

最初的节奏

2020-07-03 00:45:13

tomcat與solr整合的時候遇到的問題

tomcat和solr的整合，網上說了很多也很簡單，這裏不在贅述問題一、添加JDK 設置完之後要保證你添加的JDK和你用來編譯的JDK版本是一樣的：指定JDK：如果指定的JDK版本低於實際

2020-06-30 21:10:58

【linux】【solr】linux下solr開機自啓動腳本，成功解決solr自啓問題。

哈嘍，大家好，最近在處理solr在linux下安裝時，遇到了這麼一個問題，我們正常啓動進入到solr的bin目錄下直接solr start就直接啓動了。但如果突然有天centos7服務器重啓了，此時solr服務器也需要重啓才能使用。於是

2020-06-30 03:33:34

集成Nutch和Solr

兩年前集成Nutch 和Solr 這兩個Apache Lucene 項目組下的子項目實在是件困難的事情，需要打很多補丁(patches),爲他們的聯姻搜尋各種必需的組件(required components)。今非昔比，時下，在Solr

2020-06-29 04:40:23

lucene-全文檢索的基本原理（一）

lucene-全文檢索的基本原理（一）一、總論 Lucene是一個高效的，基於Java的全文檢索庫。我們生活中的數據總體分爲兩種：結構化數據和非結構化數據。結構化數據：指具有固定格式或有限長度的數據，如數據庫，元數據等。

2020-06-21 21:38:05

全文檢索基本理論（二）-solr

solr簡介一、Solr介紹 1. Solr是什麼　　基於Lucene的流行、高性能的開源企業級搜索平臺。Lucene下的子項目。官網鏈接： https://lucene.apache.org/solr 2. Solr的用途

2020-06-21 21:38:02

mac安裝Solr流程

（1）首先安裝jdk，因爲Solr是基於Java的。（2）homebrew安裝Solrbrew install solr（3）查看solr安裝路徑一般默認是安裝到/usr/local/bin/solr下面的。which solr（4）啓動

乞力马扎罗的雪CYF

2020-06-21 17:19:13

mac Solr配置自簽名https證書

（1）分別在mac上執行以下命令，獲得證書：keytool -genkeypair -alias solr-ssl -keyalg RSA -keysize 2048 -keypass 123456 -storepass 123456 -

乞力马扎罗的雪CYF

2020-06-21 17:19:13

solr中plugin的擴展

1. 將solr 源文件解壓，並且使用開發工具，如：Eclipse 。新建工程，並將源文件以及相關的jar 導入。 2. 在org.apache.solr.handler 包下（一般在此包下進行擴展），新建java 類。

2020-06-21 07:08:42

使用solr的addDateRangeFacet方法設置gap報錯

使用solr的addDateRangeFacet方法設置gap報錯使用solr的addDateRangeFacet方法設置gap報錯使用solr的addDateRangeFacet方法設置gap報錯先看方法solrQuery.

2020-06-21 06:48:20

Solr Admin編輯數據

Solr Admin刪除數據歡迎使用Markdown編輯器1. 刪除所有2. 指定域刪除歡迎使用Markdown編輯器 1. 刪除所有 <delete> <query>*:*</query> </delete> <commit/

2020-06-21 06:48:20

24小時熱門文章

最新文章

最新評論文章