WordDelimiterFilter把单词分割为子单词
例如:
* - split on intra-word delimiters (by default, all non alpha-numeric characters).
* - "Wi-Fi" -> "Wi", "Fi"
* - split on case transitions
* - "PowerShot" -> "Power", "Shot"
* - "//hello---there, 'dude'" -> "hello", "there", "dude"
* - trailing "'s" are removed for each subword
* - "O'Neil's" -> "O", "Neil"
这样,如果文件包含"Wi-Fi",搜索"wifi"或者"wi fi"都会match。
属性autoGeneratePhraseQueries="true" (缺省值)会将搜索的词分割成为短语查询。
例如,WordDelimiterFilter会解析“pdp-11”生成短语“pdp 11”而不是两个词PDP或者11
autoGeneratePhraseQueries="true"对于不是用空格分割的语言效果不佳。
这样,搜索“Wi-Fi”就相当于搜索“Wi Fi”
分享到:
相关推荐
少有的solr中文文档,详细说明了SOLR的文件配置,使用。
solr中文分词器
solr 中文分词
solr中Cache综述 以及部分优化策略
支持solr5.5 solr6.0中IK分词需要的资料
solr 安装与配置
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
solr中文教程,solr帮助文档,快速搭建solr
solr中的mmesg4j中文分词器安装详细步骤文档
solr 安装教程
2. home文件夹中存放apache-solr-3.6.0\example\solr中的所有文件,删除data中所有的数据,server文件夹存放apache-solr-3.6.0\example\webapps中的war包,并且解压war包,解压又两种方式:1、用解压工具;...
solr6.0的中文分词也支持solr5.x,IKAnalyzer.jar和配置文件
Solr5.4的中文分词库,解压拷贝到Solr5.4.0的WEB-INF目录下即可,如非默认数据保存路径,要修改web.xml文件
solr4.10.2与tomcat6的整合
解压出来的jar包放到apache-tomcat-9.0.20\webapps\solr\WEB-INF\lib下(Tomcat项目里solr项目)其他三个文件放到apache-tomcat-9.0.20\webapps\solr\WEB-INF\classes下(Tomcat项目里solr项目)然后进行ik分词器的...
该文档详细讲解了solr如何整合到tomcat中,并且还有附有图片说明
IKAnalyzer中文分词器本身已经不支持最新的solr 5,集成到solr中分词会报错,这里将解决了solr 5支持问题的最新IK包共享出来,希望能帮到各位! 附上IK在schema.xml中的配置: <fieldType name="text_ik" class="...
zip包含ik-analyzer-solr5-5.x.jar,ext.dic,IKAnalyzer.cfg.xml,stopword.dic。可以兼容solr7 ,亲测可用。
由于网上提供的solr中文分词器大多不吃吃6.5以上,会报错(具体错误提示忘了),这里提供高版本,内含使用教程