`
1120101929
  • 浏览: 3019 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
    在建立索引过程中,还有一个非常重要的部分, 就是Analyzer(分词器)。     回想创建IndexWriter对象时,需要一个IndexWriterConfig对象,而这个IndexWriterConfig对象的构造方法,需要一个Analyze对象作为参数。像这样:  Directory directory = FSDirectory.open(new File(indexDir)); IndexWriterConfig config = new IndexWriterConfig(Version.LATEST, new StandardAnalyzer()); In ...
    有了上一篇中建立好的索引,我们就可以完成检索任务了。     在这之前,介绍一下lucene检索有关的基本概念。 IndexReader:负责将索引文件读入内存。这里用户可以自定义索引文件编码格式,可以实现索引文件的压缩等。IndexReader的构造方法需要一个Directory对象。 IndexSearcher:lucene对外提供检索功能的类。这个类中有多个重载的search方法,负责提供检索功能。 TopDocs:保存lucene检索结果的类。 ScoreDoc:保存lucene检索结果中,Document的docId及其评分。默认情况下,lucene使用其评分机 ...
    上一篇文章中提到,使用lucene包括两个步骤:一是索引;二是检索。索引是基础、是前提,检索是目的。本文讲的是lucene的基本索引。     本文以及后面的文章都以存储在磁盘的文件为背景,进行索引和检索的演示。    ...
    学习lucene也有一段时间,有必要做一个总结。作为自己的知识积累,同时也希望给刚开始接触lucene的人一点帮助。     假设你已经知道lucene是什么、lucene的起源等知识,这些内容在文章中不会做详细的说明。     lucene是一个Java语言实现的、提供全文检索功能的框架。基于lucene,我们可以构建我们自己的搜索引擎。使用lucene包括两个基本步骤:一是建立索引过程;二是进行检索过程。     后面的几篇文章将涉及以下的内容: lucene的基本索引。 lucene的基本检索。 分词、中文分词。 QueryParser。 分组-类SQL ...
Global site tag (gtag.js) - Google Analytics