elaticserach ik自定义远程词库的方法 -

abao1

浏览: 8151 次
性别:
来自: 星星的我

最近访客更多访客>>

flickering

leimingchao

吓一跳

xyc1985414

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

elaticserach ik自定义远程词库的方法

博客分类：

java

elaticsearch es

这是ik的配置文件在配置远程扩展字典写上下面方法的接口(要注意能调取到这个方法) 把停止词典注释掉
---------------------------------------------------------------------------
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>

<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>

<entry key="ext_stopwords">custom/ext_stopword.dic</entry>

<entry key="remote_ext_dict">location</entry>

<entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry>
</properties>
---------------------------------------------------------------------------
以下是java代码部分
---------------------------------------------------------------------------
@GET
    @Path("loadGJCK")
    @Produces(MediaType.APPLICATION_OCTET_STREAM)
    @ApiOperation(value = "词库")
    public String loadGJCK(@Context HttpServletRequest request,@Context HttpServletResponse response){
        String result = "";
        try {

            StringBuilder sb = new StringBuilder();
            String[] keywords = keywordService.selectKeyWord(10l);//获取所有分词，这里可以改进使用缓存等。

            String eTag = request.getHeader("If-None-Match");
            Long modified= request.getDateHeader("If-Modified-Since");

            //设置头
            if(null == modified || -1 == modified) {
                //如果没有，则使用当前时间
                modified = System.currentTimeMillis();
            }
            // 设置头信息。
            String oldEtag = keywords.length+ "";
            response.setDateHeader("Last-Modified", Long.valueOf(modified));
            response.setHeader("ETags", keywords.length + "");

            if(!oldEtag.equals(eTag)) {
                //拼装结果
                for(String tempWord : keywords) {
                    if(!StringUtils.isEmpty(tempWord)){
                        //分词之间以换行符连接
                        if(StringUtils.isNotEmpty(sb.toString())) {
                            sb.append("\r\n");
                        }
                        sb.append(tempWord);
                    }
                }
                //result = new String(result.getBytes("ISO8859-1"), "UTF-8");
                result = sb.toString();
                //更新时间
                response.setDateHeader("Last-Modified", System.currentTimeMillis());
            }

        }catch (Exception e){
            e.printStackTrace();
        }finally {
            System.out.println(result);
            return result;
        }
    }

然后这个词库就可以用啦!

分享到：

java springcloud | 最简单的单例模式

2017-08-07 11:10
浏览 1680
评论(1)
分类:数据库
查看更多

1 楼 abao1 2017-08-07

https://github.com/medcl/elasticsearch-analysis-ik
可以参考这个

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

elaticserach ik自定义远程词库的方法

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

elaticserach ik自定义远程词库的方法

评论

发表评论

相关推荐

java springcloud

最简单的单例模式

BaseDao

使用artdialog模态对话框实现新增等功能

使用JAX-WS发布web服务

ssm框架基础配置

最近访客更多访客>>