- 浏览: 242053 次
- 性别:
- 来自: 深圳
文章分类
最新评论
-
sweed0:
为何每一段代码都重复一次呢?
spring注解实例二 -
Gary_Huangpf:
- - 插件报错啊
Ext前台分页 -
ddvk2007:
版主 我想請問你所說的mapreduce是hadoop的還是g ...
MapReduce中的Shuffle和Sort分析 -
人可木:
好问章,楼主写的相当详细。。。多谢。。。
findbugs插件的安装与应用 -
hautbbs:
按照博主的方法启动调试出现jvm terminated.Ex ...
10分钟学会使用MyEclipse断点调试js
一、字段配置(schema) schema.xml位于solr/conf/目录下,类似于数据表配置文件, 定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。 1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。 必要的时候fieldType还需要自己定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括分词和过滤,如下: 2、再来看下fields节点内定义具体的字段(类似数据库的字段),含有以下属性: 3、建议建立一个拷贝字段,将所有的 全文本 字段复制到一个字段中,以便进行统一的检索: 以下是拷贝设置: 4、动态字段,没有具体名称的字段,用dynamicField字段 如:name为*_i,定义它的type为int,那么在使用这个字段的时候,任务以_i结果的字段都被认为符合这个定义。如name_i, school_i schema.xml文档注释中的信息: 1、为了改进性能,可以采取以下几种措施: 2、<schema name="example" version="1.2"> 3、filedType <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true" /> 可选的属性: StrField类型不被分析,而是被逐字地索引/存储。 StrField和TextField都有一个可选的属性“compressThreshold”,保证压缩到不小于一个大小(单位:char) <fieldType name="text" class="solr.TextField" positionIncrementGap="100"> solr.TextField 允许用户通过分析器来定制索引和查询,分析器包括 一个分词器(tokenizer)和多个过滤器(filter) <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1"catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" /> 在分词和匹配时,考虑 "-"连字符,字母数字的界限,非字母数字字符,这样 "wifi"或"wi fi"都能匹配"Wi-Fi"。 <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> 同义词 <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"enablePositionIncrements="true" /> 在禁用字(stopword)删除后,在短语间增加间隔 stopword:即在建立索引过程中(建立索引和搜索)被忽略的词,比如is this等常用词。在conf/stopwords.txt维护。 4、fields <field name="id" type="string" indexed="true" stored="true" required="true" /> <field name="text" type="text" indexed="true" stored="false" multiValued="true" /> 包罗万象(有点夸张)的field,包含所有可搜索的text fields,通过copyField实现。 <copyField source="cat" dest="text" /> 在添加索引时,将所有被拷贝field(如cat)中的数据拷贝到text field中 作用: <dynamicField name="*_i" type="int" indexed="true" stored="true" /> 如果一个field的名字没有匹配到,那么就会用动态field试图匹配定义的各种模式。 <dynamicField name="*" type="ignored" multiValued="true" /> 如果通过上面的匹配都没找到,可以定义这个,然后定义个type,当String处理。(一般不会发生) 但若不定义,找不到匹配会报错。 5、其他一些标签 <uniqueKey>id</uniqueKey> 文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。 <defaultSearchField>text</defaultSearchField> 如果搜索参数中没有指定具体的field,那么这是默认的域。 <solrQueryParser defaultOperator="OR" /> 配置搜索参数短语间的逻辑,可以是"AND|OR"。 二、solrconfig.xml 1、索引配置 mainIndex 标记段定义了控制Solr索引处理的一些因素. useCompoundFile:通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。除非是应用程序用完了文件句柄,否则 2、查询处理配置 query标记段中以下一些与缓存无关的特性: query部分负责定义与在Solr中发生的时间相关的几个选项: 概念:Solr(实际上是Lucene)使用称为Searcher的Java类来处理Query实例。Searcher将索引内容相关的数据加载到内存中。根据索引、CPU已经可用内存的大小,这个过程可能需要较长的一段时间。要改进这一设计和显著提高性能,Solr引入了一张“温暖”策略,即把这些新的Searcher联机以便为现场用户提供查询服务之前,先对它们进行“热身”。 query中的智能缓存: 其中filterCache、queryResultCache、Named caches(如果实现了org.apache.solr.search.CacheRegenerator)可以自热。 每个缓存声明都接受最多四个属性: 对于所有缓存模式而言,在设置缓存参数时,都有必要在内存、cpu和磁盘访问之间进行均衡。统计信息管理页(管理员界面的Statistics)对于分析缓存的 hit-to-miss 比例以及微调缓存大小的统计数据都非常有用。而且,并非所有应用程序都会从缓存受益。实际上,一些应用程序反而会由于需要将某个永远也用不到的条目存储在缓存中这一额外步骤而受到影响。
false
的默认值应该就已经足够。
发表评论
-
solr服务器复制、服务器分发(shard)、Multicore(分片)配置,SolrJ的使用
2012-07-16 15:23 7245Solr服务器复制的配置 1,首先测试在本机上开启三个t ... -
Solr Replication(复制)是怎样工作的
2012-07-16 15:18 1084luence有一个 ... -
Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索
2012-07-13 17:58 916原文出处:http://blog.chenl ... -
solr学习资料收集
2012-07-13 17:57 1011学习新东西前,我一般都会先找些文章来看,整个原理呀 ... -
Searching过程详解
2012-07-11 11:41 10191.拦截请求,解析请求并构建相应的handler。 发送 ... -
solr的配置参数理解
2012-07-11 11:35 1012l dataDir参数 用于替换默认的索引数据目录(. ... -
DataImportHandler从数据库导入大量数据而内存溢出的问题
2012-07-11 11:33 1524Solr有个很方便的 ... -
Solr 3.5 + Tomcat7 + mmseg4j + 搜狗词库 -配置并运行
2012-07-11 11:22 1395这是我看到过的写的较好的一篇入门文章,个人觉得相对有些文章 ... -
solrj之二次开发
2012-07-11 11:19 1582Solrj已经是很强大的solr客户端了。它本身就包装了htt ... -
SOLR搭建企业搜索平台
2012-05-24 18:34 1781一、SOLR搭建企业搜索平台--MultiCore Solr ... -
solr理论
2012-05-24 17:11 10241、 solr基础 因为 Solr 包装并扩展了 Luc ... -
solr部署
2012-05-21 18:45 9771,从官方网站下载solr:apache-solr-3 ... -
lucene检索运算符
2012-05-05 13:05 1110lucene检索运算符: 1. “:” 指定字段查指定值 ... -
当前几个主要的Lucene中文分词器的比较
2012-01-05 15:36 14691. 基本介绍: paoding :Lucene ... -
全文检索lucene的使用和优化
2012-01-05 15:35 16141 lucene简介 1.1 什么是lucene L ... -
关于几种中文分词的比对
2011-12-06 09:34 1493目前lucene自身提供的StandardAnalyze ... -
lucene 索引 原理
2011-12-06 09:33 780Lucene是一个高性能的java ... -
lucene中QueryParser操作符的疑惑
2011-11-25 16:15 854在测试Lucene搜索时,对于 AND 与 + 的区别研 ... -
lucene学习资料收集
2011-11-25 16:09 770由于公司用到lucene,现对看到过的帮助较大的luce ... -
利用 Heritrix 构建特定站点爬虫
2011-11-25 15:41 831本文由浅入深,详细介绍了 Heritrix 在 Ecl ...
相关推荐
solrconfig.xml和schema.
里面有关于solr环境搭建的详细文档说明,还有schema.xml,solrconfig.xml这两个文件里的配置说明,还有创建索引,删除索引的代码。及性能的优化。
针对Minging Solr in Action原版书的所有相关源代码示例及所有有关schema.xml, solrconfig.xml的详细配置示例,可以直接运行,配合教程再运行源代码更有助于深入理解、掌握solr全面知识点。
5.1 schema.xml 9 5.1.1 文件分析 9 5.1.2 文档注释 13 5.2 solrconfig.xml 16 6.Solr缓存 18 6.1 filterCache 18 6.2 queryResultCache 18 6.3 documentCache 19 7.solrj wiki 19 7.1 SolrJ/Solr cross-version ...
太阳黑子::: Sunspot :: Solr是Solr的... 如果指定solr home,则该目录必须包含conf目录,该目录至少应包含schema.xml和solrconfig.xml 。 确保将schema.xml复制到Sunspot gem的solr/solr/conf目录中。 Sunspot依赖
包括solr的所有资源文件文件清单如下: IKAnalyzer.cfg.xml ik-analyzer-solr5-5.x.jar solr-analyzer-ik-5.1.0.jar managed-schema mysql-connector-java-5.1.7...solrconfig.xml data-config.xml ext.dic stopword.dic
即,data-config.xml、schema.xml、solrconfig.xml 在mysql中创建一个名为knowledge_engine的数据库 更改 data-config.xml 中的数据库凭据 运行并索引 solr。 在访问知识引擎门户 ##提取单元 这是一个eclipse项目...
1.6 分布式和复制 Solr 架构 13 2 Solr的安装与配置 13 2.1 在Tomcat下Solr安装 13 2.1.1 安装准备 13 2.1.2 安装过程 14 2.1.3 验证安装 15 2.2 中文分词配置 15 2.2.1 mmseg4j 15 2.2.2 paoding 19 2.3 多核...
2. 引入分词器的jar文件:在`server/solr/RD-Product/conf/solrconfig.xml`中配置如下信息,将`rd-lib`这个文件夹下的所有jar包引入到服务中。 <!-- 引入"contrib/rd-lib/"下所有jar文件 --> ${solr.install.dir:../...
begins with an overview of the file, then tells you how to configure cores solrconfig.xml with , how to configure the Lucene index writer, and more. solr.xml : This section discusses important topics ...
设置安装Solr 4.6.0,使用solrconfig.xml和schema.xml创建一个新集合。 从GeoNames( )下载美国数据并解压缩。 mvn包将target / geonames-geocoder-0.0.1-SNAPSHOT.jar复制到solr实例的WEB-INF / libs目录中。 运行...
项目中使用freemarker-分析.avi │ 13.静态页面生成完毕.avi │ 14.解决请求406问题.avi │ 打开必读.txt │ 淘淘商城第九天笔记.docx │ ├─10.第十天 │ 01.课后回顾.avi │ 02.课程计划.avi │ 03.单点登录系统...