IKAnalyzer - Sor - rayoo

rayoo

浏览: 210762 次
性别:
来自: 北京

最近访客更多访客>>

6880505

chengyfbj

rbw204

DTmoluo

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

IKAnalyzer - Sor

博客分类：

solr

参考:

http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters

从 http://ik-analyzer.googlecode.com/下载 IK Analyzer

解压IK Analyzer 2012FF_hf1.zip,将解压目录下的IKAnalyzer2012FF_u1.jar,

放到solr的solr/WEB-INF/lib/目录下,将 IKAnalyzer.cfg.xml,stopword.dic 放到solr/WEB-INF/lib/classes目录下

实现中文分词，配置方法如下:

<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
		<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

引用中文分词fieldType:

<field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>

完毕!

----------------------------

其他配置方法:

使用IKAnalyzer 的配置:

<schema name="example" version="1.1">
……
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
……
</schema>

使用IKTokenizerFactory 的配置:

<fieldType name="text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false"/>
……
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true"/>
……
</analyzer>
</fieldType>

分享到：

递归拷贝/删除文件/文件夹: | JDK无法通过环境变量切换问题

2014-07-22 14:11
浏览 647
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IKAnalyzer - Sor

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IKAnalyzer - Sor

评论

发表评论

相关推荐

mmseg4j动态加载词库

SolrCloud NRT 近实时搜索

SolrCloud 动态扩容方案

SolrCloud4.10.4错误: No config set found to associate with the collection

mmseg4j-solr 集成到 Solr4.10.4

Solr 空间查询

SolrCloud/ZooKeeper优化

Solr Cloud 备份

SolrJ

SolrCloud应用

ZooKeeper环境搭建

Solr新建集合节点配置

最近访客更多访客>>