论坛首页 Java企业应用论坛

发布IKAnnlyzer3.2.0稳定版 for Lucene3.0

浏览 27878 次
该帖已经被评为良好帖
作者 正文
   发表时间:2009-12-07   最后修改:2010-09-09
最新3.2.5版本已经推出,http://linliangyi2007.iteye.com/blog/758451

前言
由于Lucene3.0 API的全面升级,且不再与Lucene2.X兼容, IK Analyzer为此推出了3.2.0版本。该版本仅支持Lucene2.9 / 3.0和solr1.4的接口实现。
PS:使用Solr1.3和lucene2.9之前版本的用户请下载IK Analyzer3.1.6GA使用,谢谢!

IK Analyzer 3.2.0版本修订
  • 1.支持Lucene3.0 Analyzer实现
  • 2.移除solr1.3接口,修改solr1.4接口
  • 3.默认开放停止词功能,发布IK自带的ext_stopword.dic停止词典
  • 4.优化了IKQueryParser的性能


IK分词器对Lucene及solr的版本支持明细表



下载地址

IKAnalyzer3.2.0稳定版发布包

IKAnalyzer3.2.0稳定版使用手册





   发表时间:2009-12-07  
不错,正为lucene3.0的中文分词发愁呢
0 请登录后投票
   发表时间:2009-12-09   最后修改:2009-12-10
这也评新手?版主是不是该管管了。实在无语,又不是谈啥技术观点,怎么说也是在做开源的公益事情吧。
0 请登录后投票
   发表时间:2009-12-09  
lucene 有点怪异 无法理解为什么不向下兼容~~ ~
对了 我在用compass 不知道能不能和你的这个结合呢?
不过我能用庖丁
0 请登录后投票
   发表时间:2009-12-09  
whaosoft 写道
lucene 有点怪异 无法理解为什么不向下兼容~~ ~
对了 我在用compass 不知道能不能和你的这个结合呢?
不过我能用庖丁


compass应该也是基于lucene的,API的Interface相同,应该能兼容的。

你对lucene的疑问,也是我的疑问,估计是换人了。
0 请登录后投票
   发表时间:2009-12-10  
  不错,lz升级很快啊,学习。
0 请登录后投票
   发表时间:2009-12-10  
whaosoft 写道
lucene 有点怪异 无法理解为什么不向下兼容~~ ~
对了 我在用compass 不知道能不能和你的这个结合呢?
不过我能用庖丁


我之前也用compass,但是性能测试下来貌似并发搜索部分性能达不到预期啊,一般搜索500个并发平均响应时间1100ms,复杂一点搜索还出现过死锁,不知道ls有没有遇到这种情况。
0 请登录后投票
   发表时间:2009-12-10  
songzi0206 写道
whaosoft 写道
lucene 有点怪异 无法理解为什么不向下兼容~~ ~
对了 我在用compass 不知道能不能和你的这个结合呢?
不过我能用庖丁


我之前也用compass,但是性能测试下来貌似并发搜索部分性能达不到预期啊,一般搜索500个并发平均响应时间1100ms,复杂一点搜索还出现过死锁,不知道ls有没有遇到这种情况。


老实说,既然是全文检索,文件数据库比RDB要快的多。你把索引存数据库,中间再由JDBC协议转一手,可定不能高并发了。
0 请登录后投票
   发表时间:2009-12-10  
linliangyi2007 写道
songzi0206 写道
whaosoft 写道
lucene 有点怪异 无法理解为什么不向下兼容~~ ~
对了 我在用compass 不知道能不能和你的这个结合呢?
不过我能用庖丁


我之前也用compass,但是性能测试下来貌似并发搜索部分性能达不到预期啊,一般搜索500个并发平均响应时间1100ms,复杂一点搜索还出现过死锁,不知道ls有没有遇到这种情况。


老实说,既然是全文检索,文件数据库比RDB要快的多。你把索引存数据库,中间再由JDBC协议转一手,可定不能高并发了。


我没有把索引存在数据库中,貌似并发搜索部分的瓶颈在compass,直接在lucene基础上写要好不少
0 请登录后投票
   发表时间:2009-12-11  
发现IK Analyzer 3.2.0中一个问题:

当使用自定义词库的时候,字典文件不能有空行,
出现空行会发生,数组越界异常

查阅代码发现时 源码没有对 行内容长度做不为0判断,
所以出现数组越界,希望及时更正,

或者作者有什么特殊含义 
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics