`

如何对一个Document的不同Filed使用不同的分词器

阅读更多

如何对一个Document的不同Filed使用不同的分词器

 TonyLian 2010-01-25 

 

如题。

对于文章正文,希望使用中文分词器。

 

而用户在提交文件时让其输入的文章关键字,多个用空格分开,则希望使用WhitespaceAnalyzer进行分词并保存。

 

 

Java代码

doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));  

doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED)); 

 

doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));

doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));

 

引用 收藏 

 luckaway 2010-01-26

自己实现分词器! 研究下lucene相关的代码,还是蛮简单的! 引用 收藏 

 illu 2010-01-26

可以使用PerFieldAnalyzerWrapper

//默认为庖丁分词

PerFieldAnalyzerWrapper wrapper =

    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());

//fieldName field名称

//analyzer  field对应分词器

wrapper.addAnalyzer(fieldName, analyzer); 引用 收藏 

 TonyLian 2010-01-26

illu 写道

可以使用PerFieldAnalyzerWrapper

//默认为庖丁分词

PerFieldAnalyzerWrapper wrapper =

    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());

//fieldName field名称

//analyzer  field对应分词器

wrapper.addAnalyzer(fieldName, analyzer);

 

 

大开眼界呀!去研究一下~ 

转自:http://lucene-group.group.iteye.com/group/topic/17513

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics