跳转到内容

DS 内置分词器使用说明

分词器code中文描述demo
ik_max_wordik分词器之细粒度分词器,一般用于索引分词器,索引分词器如果选择ik_max_word,则对应查询分词器默认为ik_smart中华人民共和国端点科技-〉中华人民共和国、中华人民、中华、华人、人民共和国、人民、共和国、共和、国、端点、科技
ik_smartik分词器之粗粒度分词器,一般用于查询分词器,建议索引分词器使用ik_max_word,查询分词器使用ik_smart中华人民共和国端点科技->中华人民共和国、端点、科技
ngram_analyzer数字分词,应用于对手机号或者条码等短字符进行模糊查询场景,默认最小分割力度为212345-〉12,123,1234,12345,23,234,2345,34…
pinyin_analyzer拼音分词器,需要确保es集群已安装analysis-pinyin插件中华人民共和国端点科技->中华人民共和国端点科技、zhonghuarenmingongheguoduandiankeji、zhrmghgddkj
ik_pinyin_analyzerik+拼音分词器,使用ik分词器切词,对切完的词同时应用pinyin插件过滤翻译,需要确保es集群已安装analysis-pinyin插件中华人民共和国端点科技->中华人民共和国、zhonghuarenmingongheguo、zhrmghg、中华人民、zhonghuarenmin、zhrm、中华、zhonghua、zh、华人、huaren、hr、人民共和国、renmingongheguo、rmghg、人民、renmin、rm、共和国、gongheguo、ghg、共和、gonghe、gh、国、guo、g、端点、duandian、dd、科技、keji、kj
char_analyzer单字拆分中华人民共和国端点科技->中、华、人、民、共、和、国、端、点、科、技