参考:
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters
1:
从 http://ik-analyzer.googlecode.com/下载 IK Analyzer
解压IK Analyzer 2012FF_hf1.zip,将解压目录下的IKAnalyzer2012FF_u1.jar,
放到solr的solr/WEB-INF/lib/目录下,将 IKAnalyzer.cfg.xml,stopword.dic 放到solr/WEB-INF/lib/classes目录下
2:
实现中文分词,配置方法如下:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
引用中文分词fieldType:
<field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>
完毕!
----------------------------
其他配置方法:
使用IKAnalyzer 的配置:
<schema name="example" version="1.1"> …… <fieldType name="text" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> …… </schema>
使用IKTokenizerFactory 的配置:
<fieldType name="text" class="solr.TextField" > <analyzer type="index"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> …… </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> …… </analyzer> </fieldType>
相关推荐
IKAnalyzer-5.0.jar及solr-analyzer-extra-5.3.jar,用于solr5.3做中文分词
solr更新到6.x的版本了,ik-analyzer-5.x.jar又不好使了。 无意间从"随-忆"的博客中看到了如何去修改源代码,从而让分词器能够适应6.x的版本,亲自尝试了一下,果然可以,于是奉上了自己重新编译的jar包。 6.x的版本...
该资源为ik-analyzer-7.6.0-jar,欢迎下载学习使用哦!
solr5+和ikanalyzer集成包主要内容包括:ext.dic、IKAnalyzer.cfg.xml和stopword.dic;ik-analyzer-solr5-5.x.jar 和 solr-analyzer-ik-5.1.0.jar
支持solr5以上的ikanalyzer包和配置文件
该资源为ik-analyzer-8.5.0-jar,欢迎下载学习使用哦!
ikanalyzer-solr5.zip ikanalyzer-solr5.zip ikanalyzer-solr5.zip
中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以 2积分不黑心
ikanalyzer-solr5
ikanalyzer-2012_u6 和 IKAnalyzer2012FF_u1分词器两个版本的分词器,均有,Solr 3.x版本用u6,Solr 4.x版本用FF_u1
各位Java码农们苦苦找寻的IKAnalyzer-3.2.8.jar,直接使用maven命令行安装到本地仓库即可。也可以上传到nexus;...-DgroupId=org.wltea.ik-analyzer -DartifactId=ik-analyzer -Dversion=3.2.8 -Dpackaging=jar
IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。此包兼容solr7.x
由于林良益先生在2012之后未对IKAnalyzer进行更新,后续lucene分词接口发生变化,导致不可使用。该Jar包在原代码上进行修改,支持Solr 6.1.0的Jar包。
IKAnalyzer分词器,不错哦!! 实现了以词典分词为基础的正反向全切分算法。
solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0
中文分词器
ik-analyzer-7.6.0