`

中文分词elasticsearch-analysis-ik

 
阅读更多

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。

从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。

IK Analyzer 2012特性:

1.采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式;

2.在系统环境:Core2 i7 3.4G双核,4G内存,window 7 64位, Sun JDK 1.6_29 64位 普通pc环境测试,IK2012具有160万字/秒(3000KB/S)的高速处理能力。

3.2012版本的智能分词模式支持简单的分词排歧义处理和数量词合并输出。

4.采用了多子处理器分析模式,支持:英文字母、数字、中文词汇等分词处理,兼容韩文、日文字符

 

5.优化的词典存储,更小的内存占用。支持用户词典扩展定义。特别的,在2012版本,词典支持中文,英文,数字混合词语。

elasticsearch-analysis-ik将Ik Analyzer作为插件集成到了elasticsearch。

elasticsearch-analysis-ik的安装细节请参考github上的原文。

 

链接:IK Analyzer官网

           IK Analyzer的Maven代码链接

           elasticsearch-analysis-ik的github链接

        

分享到:
评论

相关推荐

    7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器

    elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点: 中文分词:elasticsearch-analysis-ik 是基于...

    elasticsearch-analysis-ik 7.10.0 分词器

    Elasticsearch-analysis-ik 是一个专为 Elasticsearch 设计的中文分词插件,它基于 Lucene 的 IK 分词器,旨在提供高效、准确的中文分词能力。 **IK 分词器介绍** IK (Intelligent Chinese Analyzer) 是一个针对...

    elasticsearch-analysis-ik-7.16.3.zip

    Elasticsearch的IK分词器为中文全文检索提供了强大的支持,通过"elasticsearch-analysis-ik-7.16.3.zip"插件的安装和配置,我们可以轻松地在Elasticsearch中实现对中文文本的高效分词。无论是日志分析、内容推荐还是...

    elasticsearch-analysis-ik-7.10.0.zip下载

    "elasticsearch-analysis-ik"是针对Elasticsearch的一个中文分词插件,它的主要功能是提供高效、精准的中文分词能力,使得Elasticsearch能够更好地理解和处理中文文本数据。 在Elasticsearch 7.10.0版本中,...

    最新版 elasticsearch-analysis-ik-8.7.0.zip

    最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip

    elasticsearch-analysis-ik-7.3.2.zip

    "elasticsearch-analysis-ik"是ES中最受欢迎的中文分词器之一,专为提升中文文本分析性能而设计。本文将深入探讨"elasticsearch-analysis-ik-7.3.2"这个版本,以及与其相关的技术细节。 首先,"elasticsearch-...

    最新版elasticsearch-analysis-ik-8.8.2.zip

    最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip

    elasticsearch-analysis-ik-7.16.2.zip

    elasticsearch-analysis-ik是针对Elasticsearch的中文分词插件,旨在提供高效、精确的中文分词能力。版本7.16.2是针对Elasticsearch 7.16.2的优化版本,能够与该版本的Elasticsearch无缝集成。IK分词器具有丰富的...

    IK分词器elasticsearch-analysis-ik-7.17.16

    IK分词器是针对Elasticsearch设计的一款强大的中文分词插件,其全称为"elasticsearch-analysis-ik"。在Elasticsearch中,分词器的作用至关重要,它负责将用户输入的文本进行词汇切分,以便进行后续的搜索和分析操作...

    elasticsearch-analysis-ik-7.4.2.zip.7z

    《Elasticsearch中文分词插件:elasticsearch-analysis-ik-7.4.2》 在深入探讨Elasticsearch的中文分词插件elasticsearch-analysis-ik-7.4.2之前,首先需要理解Elasticsearch的基础知识。Elasticsearch是一款高性能...

    windows版本ES7.17.3中文分词器elasticsearch-analysis-ik-7.17.3 .zip

    用于elasticsearch7.17.3这个版本的ik中文分词器,考虑到官网有时网络不稳定下载不下来,这里特意上传,方便大家使用; 目录结构如下: config -- 文件夹 plugin-security.policy plugin-descriptor.properties ...

    elasticsearch-analysis-ik-7.10.2.zip

    《Elasticsearch中文分词器:elasticsearch-analysis-ik-7.10.2》 在信息技术领域,数据处理和搜索效能是至关重要的。Elasticsearch(ES)作为一个开源的全文搜索引擎,因其强大的搜索功能和分布式特性而备受青睐。...

    最新版 elasticsearch-analysis-ik-7.9.3.zip

    最新版的`elasticsearch-analysis-ik-7.9.3.zip`正是针对Elasticsearch 7.9.3版本定制的中文分词插件,旨在优化中文文本的检索和分析性能。 `elasticsearch-analysis-ik`插件的核心功能是提供中文分词服务,它基于...

    elasticsearch-analysis-ik-6.8.0.zip

    Elasticsearch 分析...总的来说,"elasticsearch-analysis-ik-6.8.0.zip" 提供了一个方便的解决方案,使得开发者和运维人员在国内环境下也能轻松获取和安装 IK 分词器,从而优化 Elasticsearch 的中文文本处理能力。

    最新版 elasticsearch-analysis-ik-7.6.2.zip

    "elasticsearch-analysis-ik-7.6.2.zip" 是针对Elasticsearch 7.6.2版本的一个专门用于中文分词的插件,其目的是优化对中文文本的索引和查询性能。 IK分析器是Elasticsearch社区中非常流行的一个中文分词插件,由...

    elasticsearch-analysis-ik-7.15.2和7.14.0.zip

    Elasticsearch 分析插件 "analysis-ik" 是一个针对中文分词的高效工具,尤其在处理中文文本的搜索引擎优化方面表现出色。该插件的主要目的是为了更好地支持中文的全文检索,通过细致的分词处理,提高搜索结果的...

    最新版 elasticsearch-analysis-ik-7.10.2.zip

    Elasticsearch Analysis IK插件是针对Elasticsearch的中文分词器,它的全称为"elasticsearch-analysis-ik",在7.10.2版本中,该插件为用户提供了更强大的中文处理能力。本文将详细探讨这一插件的特性、安装与使用...

    最新版 elasticsearch-analysis-ik-7.17.6.zip

    Elasticsearch-analysis-ik是专为Elasticsearch设计的中文分词插件,其核心功能在于对中文文本进行有效的分词处理。该插件支持多种分词器,包括IK Smart和IK Analyzer,其中IK Smart适用于简单快速的分词,而IK ...

    elasticsearch-analysis-ik-8.2.0.zip

    elasticsearch-analysis-ik 是一个专门为 Elasticsearch 设计的中文分词插件,它支持复杂的中文分词逻辑,包括词典分词、智能分析、自定义扩展等。版本 8.2.0 与 Elasticsearch 的主要版本保持一致,确保了良好的...

    elasticsearch-analysis-ik-7.7.1 分词器下载

    "elasticsearch-analysis-ik"就是一款专为Elasticsearch设计的中文分词插件,其7.7.1版本是针对Elasticsearch 7.7.1版本优化定制的。 **IK分词器概述** IK全称为“Intelligent Chinese”,即智能中文。它由Java...

Global site tag (gtag.js) - Google Analytics