多语言展示
当前在线:1488今日阅读:60今日分享:41

elasticsearch集成中文分词工具

elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好执行下面这个请求测试一下分词效果curl 'http://localhost:9200/crxy/_analyze?pretty=true' -d '{'text':'超人学院'}'分词效果如下 所以需要修改这个分词工具
工具/原料

IK分词工具

方法/步骤
1

首先需要下载IK的源码,进行编译,打包IK插件源码下载地址https://github.com/medcl/elasticsearch-analysis-ik

2

使用maven进行编译下载的源码

3

把编译后的target/releases下的elasticsearch-analysis-ik-1.2.9.zip文件拷贝到ES_HOME/plugins/analysis-ik目录下面,然后解压

4

把下载的ik插件中的conf/ik目录拷贝到ES_HOME/config下

5

修改ES_HOME/config/elasticsearch.yml文件,添加index.analysis.analyzer.default.type: ik

6

重启es看到下图就说明启动成功了

7

测试分词效果: curl 'http://localhost:9200/crxy/_analyze?analyzer=ik&pretty=true' -d '{'text':'超人学院'}'如图所示:

8

看到这样的结果就表示IK分词器设置成功。这样的话就可以使用es中的mapping给指定索引库中的指定类型中的某个字段设置分词器curl -XPOST http://localhost:9200/crxy/emp1/_mapping -d'{'properties':{'name':{'type':'string','indexAnalyzer': 'ik','searchAnalyzer': 'ik'}}}'

推荐信息