- 浏览: 3019 次
- 性别:
- 来自: 北京
最新评论
文章列表
在建立索引过程中,还有一个非常重要的部分, 就是Analyzer(分词器)。 回想创建IndexWriter对象时,需要一个IndexWriterConfig对象,而这个IndexWriterConfig对象的构造方法,需要一个Analyze对象作为参数。像这样:
Directory directory = FSDirectory.open(new File(indexDir));
IndexWriterConfig config = new IndexWriterConfig(Version.LATEST, new StandardAnalyzer());
In ...
有了上一篇中建立好的索引,我们就可以完成检索任务了。
在这之前,介绍一下lucene检索有关的基本概念。
IndexReader:负责将索引文件读入内存。这里用户可以自定义索引文件编码格式,可以实现索引文件的压缩等。IndexReader的构造方法需要一个Directory对象。
IndexSearcher:lucene对外提供检索功能的类。这个类中有多个重载的search方法,负责提供检索功能。
TopDocs:保存lucene检索结果的类。
ScoreDoc:保存lucene检索结果中,Document的docId及其评分。默认情况下,lucene使用其评分机 ...
上一篇文章中提到,使用lucene包括两个步骤:一是索引;二是检索。索引是基础、是前提,检索是目的。本文讲的是lucene的基本索引。 本文以及后面的文章都以存储在磁盘的文件为背景,进行索引和检索的演示。 ...
学习lucene也有一段时间,有必要做一个总结。作为自己的知识积累,同时也希望给刚开始接触lucene的人一点帮助。
假设你已经知道lucene是什么、lucene的起源等知识,这些内容在文章中不会做详细的说明。
lucene是一个Java语言实现的、提供全文检索功能的框架。基于lucene,我们可以构建我们自己的搜索引擎。使用lucene包括两个基本步骤:一是建立索引过程;二是进行检索过程。
后面的几篇文章将涉及以下的内容:
lucene的基本索引。
lucene的基本检索。
分词、中文分词。
QueryParser。
分组-类SQL ...