schema.xml 在solr/conf/目錄下,類似於數據表配置文件。
爲了改進性能,可以採取以下幾種措施:
1. 將所有隻用於搜索的,而不需要作爲查詢結果的field(特別是一些比較大的field)的stored設置爲false。
2. 將不需要被用於搜索的,而只是作爲查詢結果返回的field的indexed設置爲false。
3. 刪除所有不必要的copyField聲明,根據需要決定是否進行存儲。
4. 爲了索引字段的最小化和搜索的效率,將所有的 text fields的index都設置成false,然後使用copyField將他們都複製到一個總的 text field上,然後對他進行搜索。
5. 使用儘可能高的Log輸出等級,減少日誌量。可以在solr/admin 中的 LOGGING 進行設置。
特珠說明:
1. 高高是基於分詞的,所有存儲需要高亮顯示的字段 一定要分詞(text)才能高亮顯示。
2. 排序字段 是不能當 查詢過濾的條件。
文本主要配置項:
1. field 類型定義
重點是中文分詞的添加
2. field 各屬性定義
name type類型 indexed是否建立索引 stored是否存儲 required 是否必填項 multiValued多值存儲
3. 唯一key
<uniqueKey>id</uniqueKey>
文檔的唯一標識, 必須填寫這個field(除非該field被標記required="false"),否則solr建立索引報錯。
4. 默認搜索字段 field
<defaultSearchField>text</defaultSearchField>
如果搜索參數中沒有指定具體的field,那麼這個做爲默認的域。
5. 搜索參數短語間邏輯
<solrQueryParser defaultOperator="OR"/>
配置搜索參數短語間的邏輯,可以是"AND|OR"。
備註: AND是交集,OR是並集
6. 複製字段
<copyField source="content" dest="text"/>
將多個字段的值 複製至 一個字段中,如果被複制的字段都設置爲stored,那個這個字段務必不要設置成stored=true
7. 自定義評分器
<similarity class="......SolrSimilarity"/>
SolrSimilarity 是繼承 DefaultSimilarity的子類,或者實現評分器接口的類。