`

IKAnalyzer - Sor

    博客分类:
  • solr
 
阅读更多

参考:

http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters

1:

从 http://ik-analyzer.googlecode.com/下载 IK Analyzer

 

解压IK Analyzer 2012FF_hf1.zip,将解压目录下的IKAnalyzer2012FF_u1.jar,

放到solr的solr/WEB-INF/lib/目录下,将 IKAnalyzer.cfg.xml,stopword.dic 放到solr/WEB-INF/lib/classes目录下

 

2:

实现中文分词,配置方法如下:

 

<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
		<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

 

引用中文分词fieldType:

<field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>

 

 

完毕!

 

 

 

 

----------------------------

其他配置方法:

 

使用IKAnalyzer 的配置:

 

<schema name="example" version="1.1">
……
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
……
</schema>

 

使用IKTokenizerFactory 的配置:

 

<fieldType name="text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false"/>
……
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true"/>
……
</analyzer>
</fieldType>

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics