Solr初步

僅僅作爲個人的學習記錄,英文原地地址來自官方的入門https://lucene.apache.org/solr/guide/7_5/installing-solr.html#check-if-solr-is-running

在開始使用Solr時,您只需要將Solr發行版歸檔提取到您選擇的目錄中。作爲初始開發環境,這已經足夠了,但是在設置真正的開發和生產環境之前,請注意不要對這個“玩具”安裝負擔過重。

當您完成了對Solr的初步評估之後,您將需要注意計劃您的實現。您可能需要在另一臺服務器上重新安裝Solr,或者創建一個集羣化的SolrCloud環境。

當您準備爲生產環境設置Solr時,請參閱“將Solr帶到生產”頁上提供的說明。地址:https://lucene.apache.org/solr/guide/7_5/taking-solr-to-production.html#taking-solr-to-production

我需要多大的服務器?

如何確定Solr安裝的大小是一個複雜的問題,它取決於許多因素,包括文檔的數量和結構、要存儲多少字段、用戶數量等。

強烈建議您花一點時間考慮影響Solr實現的硬件大小的因素。一個非常好的博客文章,討論了要考慮的問題是尺寸硬件在摘要:爲什麼我們沒有一個確定的答案。https://lucidworks.com/2012/07/23/sizing-hardware-in-the-abstract-why-we-dont-have-a-definitive-answer/

在計劃安裝時,需要注意的一點是,Lucene對單個索引中的文檔數量存在硬限制:大約21.4億個文檔(確切地說是2147483647)。實際上,這樣的大量文檔不太可能適合單個索引,並且在接近這個數字之前,您可能需要跨集羣分發索引。如果您知道在開始索引之前將超過文檔的總數,那麼最好從一開始就計劃使用SolrCloud作爲設計的一部分進行安裝。

SOLR目錄佈局:

  安裝Solr之後,您將在其中看到以下目錄和文件

 Bin/ :

這個目錄包括幾個重要的腳本,這些腳本將使使用Solr更加容易。

solr and solr.cmd

這是Solr的控制腳本,也稱爲bin/solr(*nix)/bin/solr.cmd(Windows)。這個腳本是啓動和停止SOLR的首選工具。在SolrCloud模式下運行時,還可以創建集合或內核、配置身份驗證和使用配置文件。

post

PostTool,它提供了一個簡單的命令行接口,用於將內容POSTing到Solr。

solr.in.sh and solr.in.cmd

這些是分別用於*NIX和Windows系統的屬性文件。這裏配置了Java、JETY和SOLR的系統級屬性。當使用bin/solr/bin/solr.cmd時,可以重寫這些設置中的許多設置,但是這允許您將所有屬性設置到一個地方。

install_solr_services.sh

該腳本用於*NIX系統安裝SOLR作爲服務。在SOLR到生產的部分中更詳細地描述了它。https://lucene.apache.org/solr/guide/7_5/taking-solr-to-production.html#taking-solr-to-production

contrib/

Solr的contrib目錄包括用於Solr專門特性的插件。

dist/

DIST目錄包含主要的Solr jar文件。

docs/

DOCS目錄包括一個鏈接到Solr的在線JavaDoc。

example/

示例目錄包括幾種類型的示例,它們演示了各種Solr功能。有關此目錄中的內容的詳細信息,請參閱下面的Solr示例部分。

licenses/

許可證目錄包括Solr使用的第三方庫的所有許可證。

server/

這個目錄是SOLR應用程序的心臟所在的地方。這個目錄中的README提供了詳細的概述,但是以下是一些重點:

Solr’s Admin UI (server/solr-webapp)

Jetty libraries (server/lib)

Log files (server/logs) and log configurations (server/resources). See the section Configuring Logging for more details on how to customize Solr’s default logging.

Sample configsets (server/solr/configsets)

Solr例子

Solr包括許多示例文檔和配置,在啓動時使用。如果您瀏覽了Solr教程,您已經與這些文件中的一些進行了交互。

https://lucene.apache.org/solr/guide/7_5/solr-tutorial.html#solr-tutorial

Exampledocs

這是一小組簡單的CSV、XML和JSON文件,在開始使用Solr時可以與bin/post一起使用。有關使用這些文件使用bin/post的更多信息,請參見POST TOOL。https://lucene.apache.org/solr/guide/7_5/post-tool.html#post-tool

 

example-DIH

這個目錄包括幾個示例數據導入處理程序(DIH)配置,以幫助您開始導入數據庫、電子郵件服務器甚至Atom提要中的結構化內容。每個示例將索引一組不同的數據;有關這些示例的詳細信息,請參閱那裏的README。

files

文件目錄提供了基本的搜索UI,用於搜索您在本地存儲的文檔,如Word或PDF。有關如何使用此示例的詳細信息,請參閱自述文件。

films

電影目錄包含一組關於電影的健壯數據,其格式有三種:CSV、XML和JSON。有關如何使用此數據集的詳細信息,請參閱自述文件。

啓動SOLR

Solr包括名爲bin/solr(Linux/MacOS)或binsolr.cmd(Windows)的命令行接口工具。這個工具允許您啓動和停止Solr,創建內核和集合,配置身份驗證,以及檢查系統的狀態。

 

使用它來啓動SOLR,您可以簡單地輸入:

bin/solr start

如果運行Windows,則可以通過運行bin \solr.cmd 來啓動Solr。

bin\solr.cmd start

這將在後臺啓動SOLR,在端口8983上進行偵聽。

當您在後臺啓動Solr時,腳本將等待以確保Solr在返回到命令行提示符之前正確啓動。

All of the options for the Solr CLI are described in the section Solr Control Script Reference.

https://lucene.apache.org/solr/guide/7_5/solr-control-script-reference.html#solr-control-script-reference

 

以特定的捆綁實例開始SOLR

Solr還提供了許多有用的示例來幫助您瞭解關鍵特性。可以使用-e標誌來啓動示例。例如,要啓動“techproducts”示例,您可以這樣做:

bin/solr -e techproducts

目前,可以運行的示例有:techproducts, dih, schemaless, and cloud。有關每個示例的詳細信息,請參閱示例配置運行的部分。

https://lucene.apache.org/solr/guide/7_5/solr-control-script-reference.html#running-with-example-configurations

從SolrCloud開始

運行雲示例在SolrCloud模式中啓動SOLR。有關在雲模式下啓動Solr的更多信息,請參閱“從SolrCloud開始”一節。

https://lucene.apache.org/solr/guide/7_5/getting-started-with-solrcloud.html#getting-started-with-solrcloud

檢查SOLR是否運行

如果您不確定SOLR是否在本地運行,則可以使用狀態命令:

bin/solr status

這將搜索計算機上運行的Solr實例,然後收集關於它們的基本信息,例如版本和內存使用情況。

就是這樣!solr正在運行。如果您需要說服力,請使用Web瀏覽器查看管理控制檯。

http://localhost:8983/solr/

如果Solr沒有運行,您的瀏覽器將抱怨它無法連接到服務器。檢查您的端口號,然後再試一次。

如果沒有使用示例配置啓動Solr,則需要創建核心(core)以便能夠進行索引和搜索。你可以通過下面的方式做到這一點:

 

bin/solr create -c <name>

比如我創建了一個 helloword 的core.

 

 

這將創建一個內核,該內核使用數據驅動模式,當您將文檔添加到索引中時,該模式嘗試猜測正確的字段類型。

若要查看創建新內核的所有可用選項,請執行:

 

bin/solr create -help

 

僅僅開始,一步一步來。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章