`

solr schema.xml 字段解析

    博客分类:
  • solr
阅读更多
fieldType  

< fieldType name =" string " class =" solr.StrField " sortMissingLast =" true " omitNorms =" true " />

  • sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上(包括:string,boolean,sint,slong,sfloat,sdouble,pdate)。
  • sortMissingLast="true",没有该field的数据排在有该field的数据之后,而不管请求时的排序规则。
  • sortMissingFirst="true",跟上面倒过来呗
 
 <fieldType name="tint" class="solr.TrieIntField" precisionStep="8" positionIncrementGap="0"/>
  •    TrieField 用于范围查询,性能比普通的数值类型要快10倍。
  • precisionStep 值越小,分割的field段就越多,索引要存储的信息也越大,同时范围查找速度也就越快。
  • positionIncrementGap:可选属性,定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误。 和multiValued
    一起使用,设置多个值之间的虚拟空白的数量 
    关于positionIncrementGap的详细说明,参考文章http://rockiee281.blog.163.com/blog/static/19385222920127225619919/
 
    <fieldType name="pint" class="solr.IntField"/>
    <fieldType name="plong" class="solr.LongField"/>
    <fieldType name="pfloat" class="solr.FloatField"/>
    <fieldType name="pdouble" class="solr.DoubleField"/>
    <fieldType name="pdate" class="solr.DateField" sortMissingLast="true"/>
  •    这些数值类型,用于对已存在的索引的兼容(由lucence或早期版本的solr创建),暂不支持范围查找
 
    <!-- A text field that only splits on whitespace for exact matching of words -->
    <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
      <analyzer>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      </analyzer>
    </fieldType>
         The optional positionIncrementGap puts space between multiple fields of this type on the same document, with the purpose of preventing false phrase
         matching across fields.

 
 <fieldType name="random" class="solr.RandomSortField" indexed="true" />
  • RandomSortField不会被存储,也不用于搜索任何数据,用于生成伪随机排序的docs。
 
Filed

     官方建议不要修改id 与_version_  filed。

    当下列可选属性被使用时,Lucene的term Vector的存储会被触发
 
  • termVectors=true|false

  • termPositions=true|false

  • termOffsets=true|false
    这些选项用于高亮以及其他配套功能的加速,但是会对索引的大小造成额外开销。
 
杂项
 <uniqueKey> 
  • solr并不强制要求schema有一个唯一字段,但schema都基都会设置一个唯一字段。官方建议不要修改这个字段。‘
  • 如果你在solrconfig.xml中启用了QueryElevationComponent 。就可以要求schema使用一个StrFiled类型的唯一字段。
 
 <defaultSearchField>
  • 当搜索fied没有被显示指定的时候,solr指该字段为默认搜索字段。 
 
<solrQueryParser defaultOperator="AND|OR"/>
  • 默认OR
 
<copyField> 
  • 你必须保证datatye 是兼容的
 
<similarity class="org.apache.lucene.search.similarities.DefaultSimilarity"/>
  • 指定评分器
分享到:
评论

相关推荐

    solrconfig.xml和schema.xml说明

    solrconfig.xml和schema.

    solr.war包solr.war包solr.war包solr.war包solr.war包

    solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...

    schema.xml说明

    solr中的schema.xml说明

    ik-analyzer-solr7.zip

    IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。此包兼容solr7.x

    solr schema solrconfig 配置文件解析

    solr schema solrconfig 配置文件解析 solr schema solrconfig 配置文件解析

    ikanalyzer-solr5.zip

    ikanalyzer-solr5.zip ikanalyzer-solr5.zip ikanalyzer-solr5.zip

    solr6.x_IK中文分词工具

    solr6.x_IK中文分词工具,solr6.x_IK中文分词工具,solr6.x_IK中文分词工具

    IKAnalyzer-solr4.x-update.zip

    通过继承Analyzer编写自定义类UseSmartIKAnalyzer和NotUseSmartIKAnalyzer,实现智能分词和最细粒度分词,支持solr4.7通过配置schema.xml实现不同的分词效果 &lt;fieldType name="text_ik" class="solr.TextField"&gt; ...

    ikanalyzer-solr6.5.zip

    solr5+和ikanalyzer集成包主要内容包括:ext.dic、IKAnalyzer.cfg.xml和stopword.dic;ik-analyzer-solr5-5.x.jar 和 solr-analyzer-ik-5.1.0.jar

    ik-analyzer-solr 6.x.x

    solr 6.x.x , ik 分词器, 可以实现对一段汉字进行分词处理, 支持配置扩展词语, 在分词时, 对特定词语不进行分词

    solr-dataimport-scheduler(Solr7.x).jar

    这是属于Solr7.X版本的全量、增量更新jar包,有很多版本的这个jar包是没有更新过的,因为这个jar包是爱好者开发的,并不是官方维护,所以很难找到,我是用了两天才找到。

    ik-analyzer-solr-6.x.jar

    solr更新到6.x的版本了,ik-analyzer-5.x.jar又不好使了。 无意间从"随-忆"的博客中看到了如何去修改源代码,从而让分词器能够适应6.x的版本,亲自尝试了一下,果然可以,于是奉上了自己重新编译的jar包。 6.x的版本...

    solr 6.x能够使用的IKAnalyzer分词器

    网上有很多关于IKAnalyzer分词器的jar,但当我们使用solr 6.x进行配置的时候,就发现会各种各样的报错,最常出现的问题就是抽象方法错误,其实就是因为我们使用的IKAnalyzer版本和solr版本不匹配导致系统无法根据...

    Mastering Apache Solr 7.x An expert guide to advancing, optimizing, 无水印转化版pdf

    Mastering Apache Solr 7.x An expert guide to advancing, optimizing, and scaling your enterprise search 英文无水印转化版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都...

    ik-analyzer-solr7.x.zip

    有 ik-analyzer-solr7以及5.5,买一赠一非常完美,下载就能用简单方便。

    Solr_5.x版本配置完成

    基于solr5.x版本,在此之上,已经配置了相应的jar包,IKAnalyzer中文分词器,和一个简单的solrHome.下载之后可以直接放到tomcat的webapps路径下启动tomcat就能运行看到效果了。

    solr-8.2.0.zip

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的...

Global site tag (gtag.js) - Google Analytics