阅读更多

3顶
0踩

互联网

转载新闻 Lucene 2.9 release

2009-09-28 11:16 by 见习记者 chenlb 评论(3) 有3615人浏览

This release has many improvements since release 2.4.1, including:

  • Per segment searching and caching (can lead to much faster reopen among other things)
  • Near real-time search capabilities added to IndexWriter
  • New Query types
  • Smarter, more scalable multi-term queries (wildcard, range, etc)
  • A freshly optimized Collector/Scorer API
  • Improved Unicode support and the addition of Collation contrib
  • A new Attribute based TokenStream API
  • A new QueryParser framework in contrib with a core QueryParser replacement impl included.
  • Scoring is now optional when sorting by Field, or using a custom Collector, gaining sizable performance when scores are not required.
  • New analyzers (PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer)
  • New fast-vector-highlighter for large documents
  • Lucene now includes high-performance handling of numeric fields. Such fields are indexed with a trie structure, enabling simple to use and much faster numeric range searching without having to externally pre-process numeric values into textual values.

See CHANGES for details.

 

While we generally try and maintain full backwards compatibility between major versions, Lucene 2.9 has a variety of breaks that are spelled out in the 'Changes in backwards compatibility policy' section of CHANGES. We recommend that you recompile your application with Lucene 2.9 rather than attempting to “drop” it in. This will alert you to any issues you may have to fix if you are affected by one of the backward compatibility breaks.

 

Binary and source distributions are available here.

 

Maven artifacts are available here.

3
0
评论 共 3 条 请登录后发表评论
3 楼 CapsLk 2009-11-03 19:26
SmartChineseAnalyzer官方提醒要慎重考虑使用。
2 楼 chenlb 2009-09-29 18:16
SmartChineseAnalyzer

项目地址: http://code.google.com/p/imdict-chinese-analyzer/
1 楼 longware 2009-09-29 10:28
good news

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • Lucene2.9 范围查询Range Query

    Apache Lucene 2.9的改进 数字的处理方式的支持,尤其是在范围查询(如“给我找出价格在0.5到9.99英镑之间的CD”)的场景下。在2.9版之前,Lucene的查询完全基于文本,因此对于数字的处理则变成了基于字符串的精确...

  • Lucene文件检索项目实战

    1、需求分析 假设有一批文档,格式有DOC、DOCX、PPT、PPTX、TXT、PDF这几种,实现一个...概括如下,文件存储系统中存放了不同类型的文件,后台通过程序提取出文件名和文件内容,使用Lucene对文件名和文件内容进行...

  • Lucene总结四:Lucene的索引文件格式(2)

    上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。下面对这三种信息一一介绍。 4.1. 正向信息 ...

  • Lucene 基本原理(四)索引的构成

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将...

  • Lucene实现SearchManager近实时搜索

    lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通 过线程跟踪,在相对很短的时间反映给给用户程序的调用 NRTManager通过管理IndexWriter对象,并将IndexWriter的一些方法(增...

  • Lucene的索引文件格式

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程...

  • 深入Lucene的索引文件

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将...

  • lucene Version parameter

    Version:(Lucene 2.9以后出现) 如果你使用Version.LUCENE_CURRENT变量,以后当你升级lucene的时候可能会发生相当大的改变。如果向后兼容对你来说比较重要,你还是需要使用比较精确的版本号。如Version.LUCENE_30,...

  • Lucene.Net 站内搜索

    Lucene.Net 站内搜索 一 全文检索: like查询是全表扫描(为性能杀手)Lucene.Net搜索引擎,开源,而sql搜索引擎是收费的Lucene.Net只是一个全文检索开发包(只是帮我们存数据取数据,并没有界面,可以看作一个数据库...

  • Lucene Change Log (Release 3.0.0 [2009-11-25])

    Lucene Change Log $Id: CHANGES.txt 881216 2009-11-17 09:45:02Z uschindler $ ======================= Release 3.0.0 2009-11-25 ======================= Changes in backwards compatibility policy ...

  • Spring+lucene+mybatis+FastDFS+memcached, maven web 开发 dependencies

    maven Spring web开发jar 依赖坐标dependencies 1.7 UTF-8 UTF-8 4.1.6.RELEASE 4.12 2.5.4 1.6.2.RELEASE org.apache.poi poi-scratchpad

  • Lucene索引删除详解

     原来的版本中Lucene的删除一直是由IndexReader来完成的,在Lucene2.9中虽可以用IndexWriter来删除,但是其真实的实现是在IndexWriter中保存了readerpool,当IndexWriter向索引文件提交删除的时候,仍然是从...

  • Lucene学习总结之三:Lucene的索引文件格式(2)

    上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。下面对这三种信息一一介绍。 4.1. 正向信息 ...

  • Lucene4 TokenStream

    package org.apache.lucene.analysis; /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for

  • Lucene3.0原理与代码分析

    Lucene 3.0 原理与代码分析 作者: forfuture1978 http://forfuture1978.iteye.com 本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。 http://www.iteye.com - 做最棒的软件开发交流社区 第 1 / ...

  • grpcio-1.3.0-cp35-cp35m-win_amd64.whl

    Python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。Python社区提供了大量的第三方库,如NumPy、Pandas和Requests,极大地丰富了Python的应用领域,从数据科学到Web开发。Python库的丰富性是Python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,Matplotlib和Seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • ASP.NET多语种网络硬盘系统的设计(源码)

    网络硬盘系统是计算机网络中比较流行的一种应用软件,但是一般的网络硬盘系统只适用于使用单一语种的人群。为满足不同语种人群对网络硬盘系统的需求,设计了多语种网络硬盘系统。采用ASP.NET 2.0开发语言,利用ASP.NET中的三层结构、B/S模式结构以及ASP.NET网页资源的设计思路,实现了包括文件夹的操作、文件的操作、网页的多语种化三个功能模块;通过文件夹功能模块,可以添加、删除、更改名字、移动、浏览文件夹;通过文件功能模块,可以查看文件属性、上传、下载、更改名字、移动文件;通过系统的多语种化模块,能够自动识别客户端的默认语言并反馈给客户端相应语言的网页。通过应用多语种网络硬盘系统,可以满足不同语种人群共享一个网络硬盘系统的需求,具有一定的应用价值。

  • pyzmq-22.0.0-cp38-cp38-win_amd64.whl

    Python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。Python社区提供了大量的第三方库,如NumPy、Pandas和Requests,极大地丰富了Python的应用领域,从数据科学到Web开发。Python库的丰富性是Python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,Matplotlib和Seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • pyzmq-22.0.2-cp39-cp39-manylinux2010_i686.whl

    Python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。Python社区提供了大量的第三方库,如NumPy、Pandas和Requests,极大地丰富了Python的应用领域,从数据科学到Web开发。Python库的丰富性是Python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,Matplotlib和Seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

Global site tag (gtag.js) - Google Analytics