`

Solr 学习(2) ——Solr配置

    博客分类:
  • Solr
阅读更多

solr配置通过两个文件,一个是solrconfig.xml,主要定义solr的处理程序(handler)和一些扩展程序;另一个是schema.xml,主要定义索引的字段和字段类型,下面分别说明两个文件的基本配置。

 

1. solrconfig

其中的配置很多,其实很多都可以保持默认,我只说几个可能会修改到的参数

1.1 dataDir

 

默认在solr/data 文件夹下建立索引 ,在solrconfig中也可修改为你指定的位置,如

 

 

 <dataDir>/var/data/solr</dataDir>

1.2 autoCommit

自动提交是指solr在建索引的时候收到请求并没用立即写入文件,而是先放到缓存中,等收到commit命令时才将缓存中得数据写入索引文件。

自动提交默认关闭,建议打开,这样建索引时省得去考虑何时发送commit命令的麻烦

 

<autoCommit>
      <maxDocs>10000</maxDocs> <!-- 触发自动提交的文档数-->
      <maxTime>86000</maxTime> <!-- 发送一个文档后触发自动提交的最长等待时间 (单位 毫秒)  -->
 </autoCommit>

 1.3 highlight

solr对高亮的默认是<em></em> ,这样其实不是很明显,高亮最好显示成突出的颜色,于是可以改成如下的红色字体显示

 

 

  <highlighting>
          。。。
   <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">
    <lst name="defaults">
     <str name="hl.simple.pre"><![CDATA[<font coler=red>]]></str>
     <str name="hl.simple.post"><![CDATA[</font>]]></str>
    </lst>
   </formatter>
  </highlighting>
 

 

2.schema

 

2.1 字段类型 fieldType

 

<fieldType name="pint" class="solr.IntField" omitNorms="true"/>
<fieldType name="plong" class="solr.LongField" omitNorms="true"/>
<fieldType name="pfloat" class="solr.FloatField" omitNorms="true"/>
<fieldType name="pdouble" class="solr.DoubleField" omitNorms="true"/>
<fieldType name="pdate" class="solr.DateField" sortMissingLast="true" omitNorms="true"/>
 

 

添加处理中文字段类型的方法,当然还需要先把相应的jar包放到lib中,具体参考前一篇博文

 

 

<fieldType name="text" class="solr.TextField">
    <analyzer class="org.apahce.lucene.analysis.cn.smart.SmartChineseAnalyzer"/>
</fieldType>

 

 

2.2 字段 Field

 

2.2.1 字段 Field

 

定义需要的字段名和它的类型,如:

 

<field name="id" type="string" indexed="true" stored="true" required="true" /> 
<field name="text" type="text" indexed="true" stored="true"  termVectors="true"  multiValued="false"/>
<field name="name" type="text_general" indexed="true" stored="true"/>
<field name="alphaNameSort" type="alphaOnlySort" indexed="true" stored="false"/>
<field name="manu" type="text_general" indexed="true" stored="true" omitNorms="true"/>
<field name="cat" type="string" indexed="true" stored="true" multiValued="true"/>
<field name="features" type="text_general" indexed="true" stored="true" multiValued="true"/>
<field name="includes" type="text_general" indexed="true" stored="true" termVectors="true" termPositions="true" termOffsets="true" />
 

 

参数

 

1 name 字段名

2 type  字段类型 由上面的字段类型给出定义

3 indexed  是否进行索引

4 stored 是否进行保存,如不保存,可以进行搜索,但不能显示该字段的内容

5 required 是否是必须字段,如若是,该字段必须有值,否则索引报错

6 multiValued 是否允许多值

下面三个参数用个图片说明下

7 termVectors 

8 termPosition

9 termOffset

 

如对Canon Power-Shot SD500 进行分词,得到如下的结果和positon,offset等参数,


 

2.2.2 动态字段 dynamic fields

 

动态字段表示,如果字段的定义没有在配置中找到,就在动态字段类型中进行查找,比如  sid_i ,就可以在动态字段类型中进行匹配,表示该字段是整形

 

 <dynamicField name="*_i"  type="int"    indexed="true"  stored="true"/>
<dynamicField name="*_s"  type="string"  indexed="true"  stored="true"/>
<dynamicField name="*_l"  type="long"   indexed="true"  stored="true"/>
<dynamicField name="*_t"  type="text"    indexed="true"  stored="true"/>
<dynamicField name="*_txt" type="text_general"    indexed="true"  stored="true" multiValued="true"/>
<dynamicField name="*_en"  type="text_en"    indexed="true"  stored="true" multiValued="true" />
<dynamicField name="*_b"  type="boolean" indexed="true"  stored="true"/>
<dynamicField name="*_f"  type="float"  indexed="true"  stored="true"/>
 <dynamicField name="*_d"  type="double" indexed="true"  stored="true"/>

 

 

 

2.2.3 复制字段 copy fields

 

复制源字段到目标字段,maxchars 限制复制的最大长度

 <copyField source="body" dest="teaser" maxChars="300"/>

 

  这样进行复制,就可以 把所有字段放在一起,这样搜索的时候就可以不用很复杂的查询组合就可以在所有字段中搜索

 

 <copyField source="*" dest="text_t"/>
 


2.3 其它参数

 

 

<uniqueKey>id</uniqueKey>

文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。这相当于数据库中得主键,如建索引时遇到重复的,则会覆盖掉以前的记录

 

<defaultSearchField>text</defaultSearchField>

 如果搜索参数中没有指定具体的field,那么这是默认的域。

 

 

<solrQueryParser defaultOperator="OR" />

配置搜索参数短语间的逻辑,可以是"AND|OR"。 

 

 

 

 

 

 

 

 

  • 大小: 33.4 KB
分享到:
评论
1 楼 青春的、脚步 2012-05-18  
求解释termVectors

相关推荐

    solr 安装与配置

    solr 安装与配置

    solr的学习

    Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。

    docker配置solr登录密码文件

    docker配置solr登录密码文件,内含配置密码的文件 、web.xml的文件 ,详情可以去看我的博客,博客地址:https://blog.csdn.net/huyande123/article/details/97110784

    Solr安装与配置

    Solr安装与配置 完整的solr配置步骤,带截图,说明很清晰。

    solr 学习笔记

    solr 学习必备,多看看吧!solr学习笔记,对于初学者不错的!来分享

    Solr入门教程-solr学习入门经典教程

    solr学习入门经典教程,赶紧学习吧,从solr的搭建讲起,中文分词器的配置

    solr4.4.0入门配置步骤

    solr4.4.0入门配置步骤 solr4.4手把手入门配置 solr4.4配置 solr4.4.0入门配置步骤 solr4.4手把手入门配置 solr4.4配置

    solr学习资料

    solr详细学习资料,是对solr的配置,以及对数据库建立索引进行了详细介绍

    solr配置搜索引擎平台

    solr配置搜索引擎平台 一、 SOLR搭建企业搜索平台 二.... 三,,,,

    solr学习入门教程

    solr 学习的入门教程,很实用的学习材料。适合初学者实用

    solr配置与安装

    Solr的配置和安装: 1. 创建一个solr的文件夹作为服务器的位置,里面再建两个文件夹一个home文件夹一个server文件夹。 2. home文件夹中存放apache-solr-3.6.0\example\solr中的所有文件,删除data中所有的数据,...

    solr学习笔记

    solr学习的关键命令使用说明,包括插入命令与查询命令

    solr配置指南

    初级solr配置,用于solr下载配置及其框架的搭建

    solr4.1安装配置

    solr4.1安装配置 IK分词器 solrJ简单操作 solr索引富文本

    Solr学习总结配置方法

    1. Solr基本介绍 2. Solr的部署 3. Solr和IKAnalyzer 4. Solr 的其他测试 比较好的solr的文章

    Solr学习笔记。。

    Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,Solr笔记,

    solr安装配置(单核、多核)

    给出了solr的安装配置说明,分单核和多核两部分

    solr.war包solr.war包solr.war包solr.war包solr.war包

    solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...

    Solr入门配置说明

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的...

    Solr学习笔记.doc

    Solr学习笔记

Global site tag (gtag.js) - Google Analytics