`

solr solrconfig.xml

    博客分类:
  • solr
 
阅读更多

 

 

一.    DataDir 参数

 

      <dataDir>/var/data/solr</dataDir>

       不用 “Solr home”/data 目录,可以指定其它别的目录来存放所有索引数据。如果使用了 replication(主从复制),它可以匹配 replication 配置。如果这个目录不是绝对的,那会是当前 servlet 容器工作目录下的相对目录。

 

 

 

二.    mainIndex

       这些值用来控制合并多个索引段 <mainIndex>

    <!-- lucene options specific to the main on-disk lucene index -->
    <useCompoundFile>false</useCompoundFile>
    <mergeFactor>10</mergeFactor>
    <maxBufferedDocs>1000</maxBufferedDocs>
    <maxMergeDocs>2147483647</maxMergeDocs>
    <maxFieldLength>10000</maxFieldLength>
  </mainIndex>

 

       1.   <useCompoundFile>

                 通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。

                这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。

                除非是应用程序用完了文件句柄,否则 false 的默认值应该就已经足够。  

 

           2.   mergeFactor

                 决定低水平的 Lucene 段被合并的频率。较小的值(最小为  2 )使用的内存较少但导致的索引时间也更慢。

                 较大的值可使索引时间变快但会牺牲较多的内存。    

 

         3.  maxBufferedDocs

                  在合并内存中文档和创建新段之前,定义所需索引的最小文档数。

                  段是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。    

 

             4.   maxMergeDocs

                   控制可由 Solr 最适合于具有合并的 Document 的最大数。

                  较小的值 (<  10 大量更新的应用程序。

                 该参数不允许lucene在任何索引段里包含比这个值更多的文档,

                  但是,多余的文档可以创建一个新的索引段进行替换。

   

             5.    maxFieldLength:  

                    对于给定的 Document,控制可添加到 Field 的最大条目数,进而截断该文档。

                    如果文档可能会很大,就需要增加这个数值。然而,若将这个值设置得过高会导致内存不足错误。 

 

 

  6.   unlockOnStartup

              unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。

                在某些情况下,索引可能会由于不正确的关机或其他错误而一直处于锁定,这就妨碍了添加和更新。

                将其设置为 true 可以禁用启动锁定,进而允许进行添加和更新。

 

 

三   高亮插件配置

 

 

  <highlighting>
   <!-- Configure the standard fragmenter -->
   <!-- This could most likely be commented out in the "default" case -->
   <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true">
    <lst name="defaults">
     <int name="hl.fragsize">100</int>
    </lst>
   </fragmenter>
 
   <!-- A regular-expression-based fragmenter (f.i., for sentence extraction) -->
   <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter">
    <lst name="defaults">
      <!-- slightly smaller fragsizes work better because of slop -->
      <int name="hl.fragsize">70</int>
      <!-- allow 50% slop on fragment sizes -->
      <float name="hl.regex.slop">0.5</float> 
      <!-- a basic sentence pattern -->
      <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str>
    </lst>
   </fragmenter>
 
   <!-- Configure the standard formatter -->
   <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">
    <lst name="defaults">
     <str name="hl.simple.pre"><![CDATA[<em>]]></str>
     <str name="hl.simple.post"><![CDATA[</em>]]></str>
    </lst>
   </formatter>
  </highlighting>
分享到:
评论

相关推荐

    solrconfig.xml和schema.xml说明

    solrconfig.xml和schema.

    solr基础知识介绍

    5.2 solrconfig.xml 16 6.Solr缓存 18 6.1 filterCache 18 6.2 queryResultCache 18 6.3 documentCache 19 7.solrj wiki 19 7.1 SolrJ/Solr cross-version compatibility 19 7.2 Setting the classpath 20 7.2.1 ...

    Solr 4.0 源代码实例

    附件包含100个以上示例,包括solr.xml、solrconfig.xml等在Jetty、Tomcat等应用服务器下的详细配置。

    Solr3.5开发应用指导

    基于Solr3.5的最新开发应用指导,文字加代码说明模式(Schedule.xml)、配置(solrconfig.xml)、索引,搜索等详细开发内容。

    solr所需资源下载(数据导入、分词器、数据库连接jar、配置文件、managed-schema)

    包括solr的所有资源文件文件清单如下: IKAnalyzer.cfg.xml ik-analyzer-solr5-5.x.jar solr-analyzer-ik-5.1.0.jar managed-schema mysql-connector-java-5.1.7...solrconfig.xml data-config.xml ext.dic stopword.dic

    solr-redis:Solr Redis扩展

    Solr Redis扩展该扩展是一个ParserPlugin,它基于Redis中存储的数据提供Solr查询... 将以下内容添加到solrconfig.xml的“ config”部分: &lt; queryParser xss=removed xss=removed&gt; &lt; str xss=removed&gt;localhost&lt;/

    solr全文检索

    里面有关于solr环境搭建的详细文档说明,还有schema.xml,solrconfig.xml这两个文件里的配置说明,还有创建索引,删除索引的代码。及性能的优化。

    Apache-Solr-Reference-Guide-v3.5

    begins with an overview of the file, then tells you how to configure cores solrconfig.xml with , how to configure the Lucene index writer, and more. solr.xml : This section discusses important topics ...

    Mining Solr In Action源代码

    针对Minging Solr in Action原版书的所有相关源代码示例及所有有关schema.xml, solrconfig.xml的详细配置示例,可以直接运行,配合教程再运行源代码更有助于深入理解、掌握solr全面知识点。

    solr6对应的IKAnalyzer分词器

    2. 引入分词器的jar文件:在`server/solr/RD-Product/conf/solrconfig.xml`中配置如下信息,将`rd-lib`这个文件夹下的所有jar包引入到服务中。 &lt;!-- 引入"contrib/rd-lib/"下所有jar文件 --&gt; ${solr.install.dir:../...

    SOLR的应用教程

    2.4.2 solrconfig.xml 25 3 Solr的应用 29 3.1 SOLR应用概述 29 3.1.1 Solr的应用模式 29 3.1.2 SOLR的使用过程说明 30 3.2 一个简单的例子 30 3.2.1 Solr Schema 设计 30 3.2.2 构建索引 30 3.2.3 搜索测试 31 3.3 ...

    geonames-geocoder

    设置安装Solr 4.6.0,使用solrconfig.xml和schema.xml创建一个新集合。 从GeoNames( )下载美国数据并解压缩。 mvn包将target / geonames-geocoder-0.0.1-SNAPSHOT.jar复制到solr实例的WEB-INF / libs目录中。 运行...

    sunspot_solr_wildcard:基于sunspot_wildcard v2.2.0

    太阳黑子::: Sunspot :: Solr是Solr的... 如果指定solr home,则该目录必须包含conf目录,该目录至少应包含schema.xml和solrconfig.xml 。 确保将schema.xml复制到Sunspot gem的solr/solr/conf目录中。 Sunspot依赖

    Knowledge-Engine:专门用于搜索教师信息的基于知识的搜索引擎

    即,data-config.xml、schema.xml、solrconfig.xml 在mysql中创建一个名为knowledge_engine的数据库 更改 data-config.xml 中的数据库凭据 运行并索引 solr。 在访问知识引擎门户 ##提取单元 这是一个eclipse项目...

    ir-generalized-translation-models:Lucene&Solr中实现的概率相关性框架中的广义翻译模型

    有关相似性计算和可能的选项(可以在solrconfig.xml中定义)的信息,请参阅api存储库。结构扩展包含Lucene和Solr将要使用的扩展类+独立的单元和集成测试LuceneEvaluation包含将Lucene用于扩展的索引和评估代码(在

    Eclipse开发分布式商城系统+完整视频代码及文档

    │ 10.solr单机版安装.avi │ 11.中文分析器配置.avi │ 12.导入数据-dao.avi │ 13.索引库导入数据-完成.avi │ 淘淘商城第七天笔记.doc │ ├─08.第八天 │ 14.搜索服务切换到集群.avi │ 01.课程计划.avi │ 02...

Global site tag (gtag.js) - Google Analytics