阅读更多
Apache项目近日同时发布了Lucene 4.0和Solr 4.0两个版本。

Apache Lucene是一个基于Java的、高性能的全文检索引擎,你可以利用它来为你的应用程序加入索引和检索功能。Lucene是目前最为流行的基于 Java 开源全文检索工具包。

Solr是基于Lucene的高性能开源企业搜索平台,它对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言。Solr高度可扩展,具备分布式搜索和索引复制功能,为世界上很多大型网站提供了搜索和导航功能。

Apache Lucene 4.0的主要特新包括:

  • 针对词(term)、文章列表、存储字段、词语向量(term vector)的索引格式可通过Codec API来实现定制。你可以从提供的实现中选择,也可以自定义索引格式。
  • 新的doc值,用于存储每个文档的类型值。
  • 现在当应用程序使用多线程进行索引时,IndexWriter同时flushes segments到磁盘,从而显著改善了性能。
  • 添加了新的索引统计。
  • 新的默认词典/index(BlockTree)索引共享前缀。
  • 索引词语不再局限于UTF-16字符,可以是编码为字节数组的任意二进制值,默认情况下,被编码为UTF-8。
  • 显著改善了搜索中使用过滤器的性能。
  • 基于文件系统的目录能够限制合并线程的IO速率,以减少合并和搜索中的IO争用。
  • 添加了一些备用的编解码器和组件。
  • FuzzyQuery速度比之前版本快了100-200倍。
  • 添加了一个新的拼写检查器DirectSpellChecker。
  • 提供了一个模块化的API,重组了之前分散在Lucene核心、发布版本和Solr中的组件,如Analyzers、Queries等。
详细信息:Apache Lucene 4.0 released

Solr 4.0也包含了大量的功能改进,详细信息:Apache Solr 4.0 released

下载地址:

  • 大小: 80.2 KB
  • 大小: 44.9 KB
11
0
评论 共 3 条 请登录后发表评论
3 楼 transist 2012-10-16 09:51
Lucene后面几版的升级,主线都没有太大改进,而在花边的增强功能花太多时间
2 楼 xiaokang1582830 2012-10-16 09:33
一直支持中
1 楼 lavafree 2012-10-15 16:35
改进挺快,有空试试!

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • C#实现CRC32校验(附完整源码)

    C#实现CRC32校验(附完整源码)

  • CRC8/CRC16/CRC32常见几个标准的算法及C语言实现

    用表驱动法来实现CRC8、CRC16、CRC32的数据校验,程序简洁,通俗易懂

  • 【VB.NET】快速哈希表(MD5、SHA、CRC32)支持输出格式文本

    这个方法主要封装了Cryptography内的类型,另外自己添加了比较常用的CRC32算法,以及数据转换到文本的方法。 不建议用这个类库内的函数进行大型数据的校验,因为这里的函数都必须要完全将数据读入内存之后执行算法。如果要进行大量数据的校验,建议自己使用递进算法进行计算。 代码 1ImportsSystem.Security.Cryptography2...

  • STM32学习之SPI

    SPI:串行外围设备接口 应用领域:EEPROM,FLASH,实时时钟,AD转换器等等 SPI是一种高速的、全双工、同步的通信总线,在芯片的管脚只占有4跟线

  • DESFire EV1 CRC32的原理与VB .Net实现

    在修改密钥(ChangeKey,0xC4)命令中,新密钥的CRC32,是根据密钥本身计算出来的。 而Cryptogram的CRC32,是由命令(0xC4)+密钥号(Key No.)+未加密的Cryptogram本身计算出来的。 例如,修改3DES(2K3DES)密钥,密钥号01。 *** ChangeKey(KeyNo= 1) * SessKey: 9C 70 56 82 5C 08 9E C8 9C 70 56 82 5C 08 9E C8 (DES) * SessKey IV:

  • 【转载】CRC32校验算法C语言版(查表法)

    STM32F103 CRC32算法配套上位机CRC算法。

  • CRC校验 算法

    uint8_t crc4_itu(uint8_t *data, uint_len length); uint8_t crc5_epc(uint8_t *data, uint_len length); uint8_t crc5_itu(uint8_t *data, uint_len length); uint8_t crc5_usb(uint8_t *data, uint_len length); ...

  • 【Python】【C++】CRC32校验

    【代码】Python、C++实现CRC32校验。

  • CRC32校验

    CRC 校验(CRC32)数据。

  • SAP 对接CBS(http方式)

    CLEAR:lv_xml_crc32_string. CONCATENATEcrc32_passwordcrc32_keyi_stringINTOlv_xml_crc32_string. CONDENSElv_xml_crc32_string. CALLFUNCTION'SCMS_STRING_TO_XSTRING' EXPORTING text=lv_xml_crc32_string encoding='8400' "GB...

  • STM32 SPI通信协议2——SPI功能选项设置

    分频系数是指UART模块将时钟频率进行分频后得到的用于传输数据的实际时钟频率,其计算公式为:分频系数 = UART时钟频率 / (波特率 x 16)。凡是串行通信就肯定有波特率,因为波特率决定了串行通信的速度,而串行通信的速度越快stm32接收的速度也就越快。如果你想让32工作的快一点,采集的频率快一点,那么可以让分频系数小一些,波特率就会变大。然后,我们需要将这个16位值的最高位(即第15位)设置为0,然后将这个16位值左移一位。看一下连接什么样的外设,在对应的手册里可以找到是多少帧的。

  • CRC32校验C#

    c# crc32 校验

  • CRC32校验原理

    CRC即循环冗余校验(Cyclic Redundancy Check):是数据通信领域中最常用的一种差错校验码,其特征是信息字段和校验字段的长度可以任意选定。 CRC校验实用程序库:在数据存储和数据通讯领域,为了保证数据的正确性,就不得不采用检错的手段。 CRC码校验原理: 发送端:发送端根据信息字段与生成多项式生产呢个CRC码,CRC码作为数据发送给接收端,同时也会把计算出的校验字段的数据一同发送(注:目的是如果接受端检测到发送的数据是正确的,接收端能够从CRC码中提取出信息字段的数据)。 接收端:接收到

  • 与J2SE1.6中CRC32算法相同的crc计算方法

    public static String getCRC32(byte[] buffer, int goalLength) { int[] table = { 0x00000000, 0x77073096, 0xee0e612c, 0x990951ba, 0x076dc419, 0x706af48f, 0xe963a535, 0x9e6495a3, ...

  • STM32 SPI 测试程序

    STM32 SPI 测试程序 有需要的研究一下

  • stm32的SPI总结

    引脚介绍 SPI 包含 4 条总线,SPI 总线包含 4 条总线,分别为 ——SS 、SCK、MOSI、MISO。它们的作用介绍如下 : 1)SS ( Slave Select):片选信号线,当有多个 SPI 设备与 MCU 相连时,每个设备 的这个片选信号线是与 MCU 单独的引脚相连的,而其他的 SCK、MOSI、MISO线则为多个设备并联到相同的 SPI 总线上,见图 15- 1。当

  • SAP_校验和替代

    验证:1、GGB0编写校验;2、GCX2维护用户出口;3、OB28激活FI校验 替代:1、GGB1编写替代;2、GCX2维护用户出口;3、OBBH激活FI替代。

  • CRC32计算以及验证方法

    CRC32计算C语言实现python实现python zlib库实现 C语言实现 UINT32 mCrcTable[256] = { 0x00000000, 0x77073096, 0xEE0E612C, 0x990951BA, 0x076DC419, 0x706AF48F, 0xE963A535, 0x9E6495A3, 0x0EDB8832, 0x79DCB8A4, 0xE0D5E91E, 0x97D2D988, 0x09B64C2B, 0x7E

  • C#: CRC8,CRC16,CRC32 校验代码

    说明:CRC即循环冗余校验码(Cyclic Redundancy Check):是数据通信领域中最常用的一种查错校验码,其特征是信息字段和校验字段的长度可以任意选定。循环冗余检查(CRC)是一种数据传输检错功能,对数据进行多项式计算,并将得到的结果附在帧的后面,接收设备也执行类似的算法,以保证数据传输的正确性和完整性。

Global site tag (gtag.js) - Google Analytics