IKAnalyzer3.2.0稳定版已经发布,支持Lucene3.0和solr1.4
链接:
http://www.iteye.com/topic/542987
V3.1.1GA -- V3.1.5GA 版本变更一览
- 1.添加“正向最大切分算法”。
- 2.完善IK Analyzer对solr1.3版本的集成支持
- 3.改进对文件名、邮件地址、英文数字混合字串的切分算法
- 4.新增对停止词(stopword)的自定义扩展
- 5.支持对JDK1.5的版本的集成
V3.1.6GA版本变更:
新增IK Analyzer对solr1.4版本的集成支持
1.新增org.wltea.analyzer.solr.IKTokenizerFactory14,支持solr1.4的TokenizerFactory接口配置
类org.wltea.analyzer.solr.IKTokenizerFactory14
说明:该类继承与solr1.4的BaseTokenizerFactory,是IK分词器对solr1.4项目TokenizerFactory接口的扩展实现。从版本V3.1.6起。
属性:isMaxWordLength。该属性决定分词器是否采用最大词语切分。
solr1.4配置样例
使用IKAnalyzer的配置
<schema name="example" version="1.1">
……
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
……
</schema>
使用IKTokenizerFactory14的配置
<fieldType name="text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory14" isMaxWordLength="false"/>
……
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory14" isMaxWordLength="true"/>
……
</analyzer>
</fieldType>
下载 :
IKAnalyzer3.1.6GA完整包
更多详细请参看
《IKAnalyzer中文分词器V3.1.6使用手册》
分享到:
- 2009-11-08 23:10
- 浏览 11741
- 评论(33)
- 论坛回复 / 浏览 (30 / 14111)
- 查看更多
相关推荐
IKAnalyzer中文分词器V3.1.6使用手册.pdf
IKAnalyzer中文分词器v2012使用手册,中文文档,带书签
IKAnalyzer中文分词器V3.1.1使用手册 IKAnalyzer中文分词器V3.1.1使用手册
IKAnalyzer 中文分词器V3.2使用手册 lucene
IKAnalyzer中文分词,计算句子相似度
提供IK Analyzer 2012 使用说明手册,这个是IK Analyzer最新版的说明手册,对于想要学习IK Analyzer来说,非常适合起步的指导。
IKAnalyzer中文分词器V3.2.0,里边包含jar包,源码,词典和配置文件
IK-Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包,也就是可以将一串中文字符分割成一个个的词组或者字词 文件中包含分词工具 ikanalyzer-2012_u6.jar 中文分词配置 IKAnalyzer.cfg..xml
IKAnalyzer中文分词器V2012_U5使用手册
IKAnalyzer3.2.8 source,IKAnalyzer中文分词器V3.2.0使用手册
提示:IKAnalyzer中文分词器支持Lucene6.0以上,IKAnalyzer中文分词器支持Lucene6.0以上。
IKAnalyzer中文分词器V3.2.0使用手册
IKAnalyzer中文分词器 v3.2.0 稳定版本的源码包
IKAnalyzer非常易用的java分词工具。可以自定义扩展词汇。 这个是一个完整的java项目demo。直接可以用,不用再去google下载了。添加了几个自定义词汇,测试好用。 运行ika.java里的main方法即可
\IKAnalyzer中文分词器V3.1.3使用手册.pdf
IKAnalyzer中文分词器,里面包含jar包,html文档,pdf文档以及源码