6.搜索引擎的性能考虑信息:
索引数字:针对数字的检索必须选择支持数字的分析处理器(WhitespaceAnalyzer和StandardAnalyzer)但是SimpleAnalyzer和StopAnalyzer不知此数字分析;针对数字一般采用 Field.Keyword被检索。在索引中添加它们的原始之前,Luence对域对象使用用字典顺序查找的。类似英语单词在字典中查询。
索引日期:在检索日期时使用Field.Keyword(String,Date)和DateField类,对日期检索,Luence内部使用DateField类将给定的日期转换为适合的字符串类型处理。对字符串的格式化采用字典顺序,这样的目的是便于针对日期范围做查询。
调整索引性能的参数
|
IndexWriter参数
|
系统属性
|
默认值
|
描述
|
mergeFactor
|
Org.apache.luence.mergeFactor
|
10
|
控制段的合并频率和大小
|
maxMergeDocs
|
Org.apache.luence.maxMergeDocs
|
Integer.MAX_VALUE
|
限制每个段的文档数量
|
minMergeDocs
|
Org.apache.luence.minMergeDocs
|
10
|
控制索引时RAM使用的总量
|
7. 内存中的索引:RAMDirectory
Luence把新加的文档先保存在内存中后才把它们存到硬盘上,并通过这中方法来进行内存缓冲,如果你正在使用FSDirectory(一个基于文件的具体实现)以上的缓存操作将自动的,透明的的完成。但是你希望对索引过程,内存使用情况和从内存缓冲区到磁盘传送文件的频率某方面进行更多的控制。此时可以把RAMDirectory当作内存缓冲器使用。
RAMDirectoy在内存中所进行的操作哦比FSDirectory在磁盘上所完成的工作快的多。
分享到:
相关推荐
用来测试luence运行的结果是否正确。运行直接使用即可。
lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习...
lucene 2.9 API , lucene API,lucene 学习资料,lucene2.9 CHM
完整的IKanalyzer2012和luence4.3.0、luence3.6.1的压缩包,内含有IKAnalyzer2012的说明文档
Luence和ElasticSearch面试准备.docx
获取全部Luence数据
lucene 原理与分析,底层源码解析,应用场景及实践,相关配置
Luence.Net搜索Demo
Luence in Action 中英文 pdf
luence4.6 源代码
利用Luence.net做的搜索,实现搜索高亮,盘古分词,只能匹配,是做搜索的好例子。
下载可运行。 使用前后端分离架构, 使用springMvc 、 spring、 mybatis、 luence等技术开发的开源知识库所有后台代码
使用luence索引数据库中的记录,完整的例子
包含翻译后的API文档:lucene-core-7.3.1-javadoc-API文档-中文(简体)版.zip; Maven坐标:org.apache.lucene:lucene-core:7.3.1; 标签:apache、lucene、core、中文文档、jar包、java; 使用方法:解压翻译后的API...
lucene基础学习笔记&源码
首先读取文件,添加数据库记录,然后lucene读取数据库生成索引文件,再通过lucene检索
基于ajax与luence构建搜索引擎的设计和实现论文.doc
VerticalSearcher基本的垂直搜索引擎,实现了基本的网络爬虫功能以及用Luence实现检索
基于ajax与luence构建搜索引擎的设计和实现_论文.doc
stopword+dic 分词器分析