搜索爲將 -- Solr 6.6 從入門到進階(一)

前言

1、私信請在SegmentFault 傳送點 https://segmentfault.com/a/1190000010959342,有問必答
2、轉發請註明出處 http://3dot141.cn/blogs/29869.html,也給小可愛一點出名的機會嘛

一、版本介紹

tomcat 9
JDK 1.8
solr 6.6

二、流程介紹

  1. 官網下載 solr 6.6 然後解壓到文件夾。

  1. 將 server/server-webapp 下的 webapp 複製到 tomcat 的 webapp 包下


並改名爲 solr 

  1.  打開 在 tomcat 下的 solr 項目, solr ( webapp 改名後的solr )/WEB-INF/web.xml 文件,在開頭找到類似代碼,取消註釋並修改,如下

    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/Programme/0-Java/J_workspace/solr_home</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

注:此處是我的 solrhome 的文件位置 , 你可以自行設置

  1. 將 server/lib 下的 metrics-.jar 包 與 dist 下的 solr-dataimporthandler- .jar 包 複製到你在tomcat / webapp 下的 solr /WEB-INF/ lib 目錄中。

  2. 將 server/resources 目錄下的 log4j.properties 文件 拷貝到 tomcat/webapp/solr/WEB-INF/classes 目錄下,沒有,就自己新建一個。

  3. 自己根據上文 web.xml 中配置的 solr/home 信息,建立 solr_home 文件夾 。並將 server / solr  下的文件全部 拷貝到 solr_home 文件夾下。

  1. 在 solr_home 目錄下建立一個 文件夾,new_core 作爲 你 的solr_core。並將 上圖中 configsets / sample_techproducts_configs 目錄下的 conf 文件夾 拷貝到 new_core 文件夾下。


  1. 配置 lib 標籤。
    將 solr 6.6 壓縮包內的 contrib 與 dist 文件夾 複製到 solr_home 文件夾下。


打開 new_core/conf/solrconfig.xml 文件,從中找到如下代碼形式。

<lib dir="${solr.install.dir:

將之更改爲如下形式

  <lib dir="${solr.install.dir:..}/contrib/extraction/lib" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-cell-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/clustering/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-clustering-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/langid/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-langid-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/ltr/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-ltr-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/velocity/lib" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-velocity-\d.*\.jar" />

解釋一下,這裏的根目錄是 你自身的 solr_core 目錄。對我來說 ,就是 new_core 所在的目錄。

所以 


../  == solr_home 目錄
  1. 成果展示

打開http://localhost:8080/solr/index.html 會出現如下畫面

三、可能出現的異常

根據這位博主的文章http://www.jianshu.com/p/dd7a...

總結如下:

1.啓動tomcat時如果報下面的錯誤:

嚴重: Exception starting filter SolrRequestFilter
java.lang.NoClassDefFoundError: com/codahale/metrics/MetricSetat java.lang.Class.getDeclaredConstructors0(Native Method)
at java.lang.Class.privateGetDeclaredConstructors(Class.java:2671)
at java.lang.Class.getConstructor0(Class.java:3075)at java.lang.Class.newInstance(Class.java:412)
at org.apache.catalina.core.DefaultInstanceManager.newInstance(DefaultInstanceManager.java:119)
at org.apache.catalina.core.ApplicationFilterConfig.getFilter(ApplicationFilterConfig.java:258)
at org.apache.catalina.core.ApplicationFilterConfig.<init>(ApplicationFilterConfig.java:105)
at org.apache.catalina.core.StandardContext.filterStart(StandardContext.java:4700)
at org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5340)
at org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:145)
at org.apache.catalina.core.ContainerBase.addChildInternal(ContainerBase.java:753)
at org.apache.catalina.core.ContainerBase.addChild(ContainerBase.java:729)
at org.apache.catalina.core.StandardHost.addChild(StandardHost.java:717)
at org.apache.catalina.startup.HostConfig.deployDirectory(HostConfig.java:1092)
at org.apache.catalina.startup.HostConfig$DeployDirectory.run(HostConfig.java:1834)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)Caused by: java.lang.ClassNotFoundException:com.codahale.metrics.MetricSet
at org.apache.catalina.loader.WebappClassLoaderBase.loadClass(WebappClassLoaderBase.java:1333)
at org.apache.catalina.loader.WebappClassLoaderBase.loadClass(WebappClassLoaderBase.java:1167)
... 20 more

請把solr-6.4.1/server/lib下的metrics-core-3.1.2.jar,metrics-ganglia-3.1.2.jar,metrics-graphite-3.1.2.jar,metrics-jetty9-3.1.2.jar,metrics-jvm-3.1.2.jar這幾個jar包放到tomcat下的solr項目的WEB-INF/lib目錄下。

2.訪問http://localhost:8080/solr/index.html時如果報下面的錯誤:

HTTP Status 403 - Access to the requested resource has been denied

把tomcat下的solr項目的web.xml文件中

<security-constraint>
  <web-resource-collection>
    <web-resource-name>Disable TRACE</web-resource-name>
    <url-pattern>/</url-pattern>
    <http-method>TRACE</http-method>
  </web-resource-collection>
  <auth-constraint/>
</security-constraint>
<security-constraint>
  <web-resource-collection>
    <web-resource-name>Enable everything but TRACE</web-resource-name>
    <url-pattern>/</url-pattern>
    <http-method-omission>TRACE</http-method-omission>
  </web-resource-collection>
</security-constraint>

這段註釋掉。這段配置限制了對solr資源的訪問,註釋掉就可以訪問了。

3.java.lang.NoSuchMethodError:

解決:solr5.5以上版本在tomcat8下運行
由於solr5.5.0和solr5.5.1 版本部署在tomcat7下的時候,會報Java.lang.NoSuchMethodError: javax.servlet.ServletInputStream.isFinished()Z的錯誤,這個是serverlet3.1纔有的方法。

4.javax.servlet.ServletInputStream.isFinished

解決:solr5版本以上的部署最好使用JDK1.8
solr5版本以上的部署最好使用JDK1.8,雖然官網沒有明確表示solr5必須是要使用JDK1.8,但是其中一部分功能鎖需求的JDK版本在JDK1.7以下是沒有的
比如:Java.lang.NoSuchMethodError: javax.servlet.ServletInputStream.isFinished()Z
我是在全量索引的時候發生的此異常提示:找不到ServletInputStream類下面的isFinished()方法,那麼現在我們找到該類ServletInputStream
如果在這個類下面沒有isFinished()方法,那就是JAR包問題,這個類所在的jar包是servlet-api.jar

5.待解決:

web.xml 文件中 的 <welcome-file-list> 標籤失效的原因 。

正常部署後,直接訪問 localhost:8080/solr 應該就可以使用,但是,會出現不能加載 UI 的說明。

只有訪問 localhost:8080/solr/index.html 纔可以正常加載。

分析web.xml 文件,發現一段 servlet 配置

  <servlet>
    <servlet-name>LoadAdminUI</servlet-name>
    <servlet-class>org.apache.solr.servlet.LoadAdminUiServlet</servlet-class>
  </servlet>    
  <servlet-mapping>
    <servlet-name>LoadAdminUI</servlet-name>
    <url-pattern>/index.html</url-pattern>
  </servlet-mapping>

但是,自己太菜,分析不出原因。所以還需要,之後的學習中多注意。

四、與中文分詞器的適配

1.smart-cn

從 solr-6.6.0/contrib/analysis-extras/lucene-libs 下拷貝 lucene-analyzers-smartcn-6.6.0 到 apache-tomcat-9.0.0.M20/webapps/solr/WEB-INF/lib 目錄下。

  1. 打開 solrhomenew_coreconf 下的managed-scheme 文檔

  2. 加入以下內容

<fieldType name="text_sm" class="solr.TextField">
    <analyzer class="org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer" /></fieldType>

或者可以使用TokenizerFactory

<fieldType name="text_sm" class="solr.TextField" >
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
       <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

2.IKAnalyzer

這裏有最新適配 solr6.6 的 IKAnalyzer,這裏是 適配攻略
進入可下載. 下載地址
下載後,將IKAnalyzer.jar 包 拷貝到 apache-tomcat-9.0.0.M20/webapps/solr/WEB-INF/lib 目錄下

  1. 打開 solrhomenew_coreconf 下的managed-scheme 文檔

  2. 加入以下內容

<fieldType name="text_ik" class="solr.TextField">
        <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

或者可以使用TokenizerFactory

<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
       <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
    </analyzer>
</fieldType>
  1. 成果展示

輸入圖片說明

結語

以上就是對 solr 進行的一些簡單操作,下一篇文章將會介紹如何將 solr 與 java 、 mysql 數據庫結合起來,使用。

喜歡的話可以點一下收藏,與關注哦~,碼字不易。
謝謝~~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章