分析:Nutch在索引时进行分析所使用的二元语法技术与查询过程中对短语的优化技术结合在一起。
public class NutchExample{
public static void main(String[] args) throws IOException{
NutchDocumentAnalyze analyer=new NutchDocumentAnalyzer();
displayTokenWithDetails(analyzer,"The quick brown fox...");
net.nutch.searcher.QuerynutchQuery=net.nutch.searcher.Query.parse("\"the quick
brown\"");
Query query=QueryTranslator.translate(nutchQuery);
System.out.println("query="+query);
}
}
输出为
1:[the:<WORD>][the-quick:gram]
2:[quick:<WORD>]
3:[brown:<WORD>]
4:[fox:<WORD>]
可见th-quick和the处于相同位置,Nutch没有错过停用词,因为很多进修停用词和后面的词一起表达语意
分享到:
相关推荐
完整的《Lucene+nutch搜索引擎开发》PDF版一共83.6M,无奈我上传的最高限是80M,所以切成两个。这一个是主文件,还需要下载一个副文件Lucene+nutch搜索引擎开发.z01。解压时直接放到一起,解压这个主文件就行了。
Nutch 是基于Lucene的,Lucene为 Nutch 提供了文本索引和搜索的API,所以它使用Lucene作为索引和检索的模块。Nutch的开放源代码方便任何人去查看Nutch排序算法的工作流程。因此Nutch就可以更好的发展,为那些爱好...
学习Lucene和Nutch的入门书籍,学习搜索引擎开发值得一看的书籍
Lucene+nutch搜索引擎开发(全本2-1),本电子书共两部分
Lucene nutch 搜索引擎开发 Part1
apache-nutch-2.3.1-src.tar ,网络爬虫的源码, 用ivy2管理, ant runtime 编译 apache-nutch-2.3.1-src.tar ,网络爬虫的源码, 用ivy2管理, ant runtime 编译
licene 实例代码 nutch实例代码 lucene+nutch搜索引擎开发实例代码(王学松版)
[硕士论文]_基于Nutch的垂直搜索引擎的分析与实现.pdf 一个例子学懂搜索引擎(lucene).doc 中文搜索引擎技术揭密.doc 九大开源搜索引擎介绍.txt 基于Nutch的搜索引擎技术.pdf 基于开源工具搭建小型搜索引擎.pdf 整合...
《Lucene+nutch搜索引擎开发》书附带的源代码
Lucene+nutch搜索引擎开发(全本2-2),本电子书共两部分
Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料
Lucene+Nutch搜索引擎开发
Lucene+Nutch搜索源码.part1.rar Lucene+Nutch搜索源码.part2.rar
介绍了lucene和nutch的基本应用,适用于学习lucene和nutch的初学者
完整的《Lucene+nutch搜索引擎开发》pdf版一共有83.6M,无奈我上传的上限是80M,所以切成两个。这个是副文件,还有个主文件http://download.csdn.net/detail/spring123tt/4361166 ,解压时,将两个文件放在一起解压...
lucene+nutch搜索引擎开发一书源码第一部分,因为源码太大,所以分两部分。
lucene+nutch搜索引擎(1-11章源码)
Lucene+nutch搜索引擎开发(源代码),内含本书的PDF电子下载地址。
lucene和nutch的一些源代码 适合想学习搜索引擎的同学学习