查看分詞的命令, ES配置完成後需要測試分詞,看看分詞是否達到預期效果。
curl 命令查看:
1. 使用自定義的分析器查看分詞:ansj_index_synonym:自定交分析器名稱. pretty :json格式顯示
curl -XGET 'http://localhost:8200/zh/_analyze?analyzer=ansj_index_synonym&pretty' -d '童裝童鞋'
2. 使用自定義的分詞器(tokenizer)和過濾器(filters)查看分詞:
curl -XGET 'http://localhost:8200/zh/_analyze?tokenizer=ansj_index&filters=synonym&pretty' -d '童裝童鞋'
3. 查詢某個字段的分詞:
curl -XGET 'http://localhost:8200/zh/_analyze?field=brand_name&pretty' -d '童裝童鞋'
“brand_name”:字段名稱,如果是字段是nest,object類型,也可以寫成"brand_name. name"
除了自定義自己的分析器,ES自己也有內置分析器如:
standard
simple
whitespace
stop
keyword
pattern
language
snowball
custom
需要英文好點在同鞋。
ES還內置了分詞器和過濾器:
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-tokenizers.htmlstandard
edge_ngram
keyword
letter
lowercase
ngram
whitespace
pattern
uax_email_url
path_hierarchy
ascii folding
length
lowercase
uppercase
nGram
edge_ngram
porter_stem
shingle
stop
word_delimiter
stemmer
stemmer_override
keyword_marker
keyword_repeat
kstem
snowball
phonetic
synonym
reverse
elision
truncate
unique
pattern_capture
pattern_replace
trim
limit
hunspell
common_grams
normalization
delimited_payload
keep_words