`
strayly
  • 浏览: 93595 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

lucene搜索优化(转)

阅读更多
1、对于按创建时间的排序可以使用doc.id的方式
new SortField(null, SortField.DOC, reverse)排序方式尽量使用INT类型的字段
也就是按照写入索引的顺序排序
2、对于时间字符串的排序可以转换成整数进行排序
3、去掉不必要的parse
使用TermQuery替换
4、TermQuery和Term可以只保留一个实例
createTerm(text)
5、减少Doc到model的转换
索引出来String到Date的转换多余而且费时
直接使用Doc对象包装成JSONObject
6、MultiFieldQueryParser改成自己用boolean查询重构
7、减少请求参数的包装类
8、搜索排序方法可以作为常量
将sort参数变成int型,使用swich进行判断
10、使用HitCollector类来适应不同情况下,Hits的大小
新、旧接口
相关搜索接口
11、使用尽可能快的磁盘IO
12、日志,先写文件,每天批量入库
13、增量索引使用reopen
新的reopen()方法只会加载那些变更过的索引片断,而不是重新加载完整的索引。
14、setMergeFactor 在做实时索引的时候,可以设置的小一点
这样就会及时索引进去
我再补充一个很重要的,对searcher使用单例模式,对性能有明显的改善,可以设置一个缓存时间,比如没10分钟预热一下

分享到:
评论
1 楼 strayly 2010-03-22  
我采用和ehcache缓存结合使用单例模式
使用ehcache在内存中设置一个缓存,时间为10分钟。
当IndexSearcher对象不存在时,创建静态对象同时在缓存中写入一个值,表示对象已经存在了.
搜索时如果缓存过期,则重新创建IndexSearcher

相关推荐

Global site tag (gtag.js) - Google Analytics