1. LUCENE-478:新版在StandardAnalyzer将CJK分割为CJ, K,对于中文分词基本没用,隐士自创的中文分词基本没有修改直接使用,没有问题。
2. LUCENE-438:Token的final终于被砍了,大快人心。当初为了实现中文分词,隐士本想继承Token,加入一些中文相关的metadata,无奈Token被阉,隐士只好另起炉灶重写了好多代码,这次算是迟来的正义吧,将代码重构一下是正道,无奈项目催得紧,以后再重构了,暂时不会负面影响。
3. 好些deprecated的玩意都被砍了,好在隐士实现的所有应用都没有调用过deprecated的东西,所以没有修改过一行代码。
4. 经过试验验证:2.1.0可以兼容读取2.0的索引文件,2.1.0可以增量索引2.0的索引文件,optimize后索引文件是2.1.0的格式。这个相当方便,可以平稳过渡至新版本,相当于无痛分娩。
5. LUCENE-771:lock文件现在移到了索引目录,很简洁,一目了然。
6. LUCENE-565:重量级的功能,IndexWriter.updateDocument闪亮登场,隐士赶紧把delete/add替换成updateDocument。至于到底能提高多少性能,有待观察。
7. LUCENE-701:Lockless commits挺诱人的,看了一下IndexReader,deleteDocuments还在,没深入研究和IndexWriter的deleteDocuments有什么区别。
8. LUCENE-544:这个也是好东西哦,MultiFieldQueryParser可以允许为Field指定boost了。
9. LUCENE-723: 可以接受*:*哦,比较危险,一定要过滤这样的玩意,不然整个数据库就裸奔了。
总结下来,隐士除了用lucene-core-2.1.0.jar代替lucene-core-2.0.0.jar和把delete/add替换为updateDocument外什么都没做就顺利切换到2.1.0了。
分享到:
相关推荐
全面好用的lucene 2.0 api以及lucene 3.0 api帮助文档
开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料,总共有30M,只上传了几个例子. ch2-lucene入门小例子 myReserch-可用的网络搜索引擎
本软件是开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料,不过由于代码很大,只发布其中最全的部分,各章的源码就不发了。
lucene-misc-2.1.0.jar lucene-misc-2.1.0.jar
lucene java 搜索引擎 比较经典的全文搜索引擎,最近发现在官方网站上找不到了,放在这里给大家,方便点,多谢谢支持!
这是Lucene 2.0+Heriterx书源代码里ch7文件夹下的lib文件,里面都是ch7项目里jar包,Lucene 2.0+Heriterx书源代码-ch7lib
自己学习Lucenes 2.0 和Heritrix之后的总结
Lucene.2.0的API文档合集 是从html装成chm的
lucene 2.0虽然是比较老的技术,它对实时搜索支持交差,不过很多普通的搜索引擎对实时性要求并不是很高,并且对于分词上没有太多的个性化专业要求,那么这个选择将是非常好的,提供各类分词接口、存储接口、索引接口...
Lucene2.0+Heritrix搜索引擎 随书光盘
lucene-2.0开发专用
Lucene.net 2.0 API,Lucene.net 2.0 dll,Lucene.net学习探索着必备。
Lucene2.0+Heritrix(ch3源代码)
lucene2.0+heritrix的随书光盘,有很多好用的lucene实例,还包括一个完整的垂直搜索引擎的设计
【别下这个哈,,】 【完整版的在】《开发自己的搜索引擎-Lucene 2.0 Heritrix》 http://download.csdn.net/source/1756566 文件大小:24.60 MB
Lucene.Net 2.0 源码+文档
Lucene2.0+Nutch0.8 API帮助文档,以前每次查看他们的API都得通过他们的网站去获取,实在麻烦。功夫不负有心人,通过自己的努力终于获得他们CHM格式的API,现在拿来跟大家分享一下
NULL 博文链接:https://fishhappy365.iteye.com/blog/456739
开发自己的搜索引擎--Lucene 2.0+Heritrix(爬虫)第10章
【完整光盘24.5M】开发自己的搜索引擎-Lucene 2.0+Heritrix.zip 评论+评分后即可返回1分。。O(∩_∩)O 。。谢谢支持。。