solr服务搭建完成(索引已建立,可以进行搜索)
现象: 搜索" 美女"后,“美女美女美女美女”文档会出现第一位。
原因: 文档中关键词出现次数,默认的tf,即文档频率值就大,所以总是出现 在第一们。
但实际系统中可能并不需要 这种结果
这个时候的解决办法:根据自己业务需要进行重写评分器
1. 自定义评分器
package cn.xxt.solr.util;
import org.apache.lucene.search.DefaultSimilarity;
/**
* vtigu评分器
* @author zhaoguoli
* @version V1.0 2012-11-04
*/
@SuppressWarnings("serial")
public class VtiguSolrSimilarity extends DefaultSimilarity{
public float tf(float freq) {
return 1.0f;
}
public float tf(int freq) {
return 1.0f;
}
}
2. 添加至solr 配置文件 schema.xml
<!-- <similarity class="org.apache.lucene.search.DefaultSimilarity"/> -->
<similarity class="cn.xxt.solr.util.VtiguSolrSimilarity"/>
3. cn.xxt.solr.util.VtiguSolrSimilarity需要放置在 solr.war包中
路径为 WEB-INF/classes/cn/xxt/solr/util/目录下。
4. 重新启动 solr服务即可。
分享到:
相关推荐
solr评分 solr自定义评分组件demo.zip
通过solr实现电商搜索排名打分,排序,可自定义打分规则
自定义的Solr 分词器,可以通过竖线"|"来分词,可以在博客http://blog.csdn.net/jiangchao858/article/details/68954044看到生成过程与使用步骤。
solr安装ik分词器将jar复制到solr\WEB-INF\lib 中 具体使用:https://mp.csdn.net/postedit
solr 中文查询分词器,把一串字符分作多个词语进行查询
solr中文分词器
solr中文解析器以及使用文档,配合blog使用
solr评分
基于solr4版本,jdk6。 solr functionquery函数查询功能强大,但字符串函数比较缺乏,该示例是contain示例,表示值中包含传入的字符串即返回1 否则返回0,可用于solr查询中如果某个字段包含动态传入的值在排名优先。...
solr搜索框架的中文分词器文件及配置详解供大家下载,亲测可用.解压出来的jar包放到apache-tomcat-9.0.20\webapps\solr\WEB-INF\lib下(Tomcat项目里solr项目)其他三个文件放到apache-tomcat-9.0.20\webapps\solr\...
solr7.3.1种需要的中文IK分词器,其中包括IK分词的jar和配置文件还有mmseg4j
k-analyzer-solr,solr分词器,包括在solr的core中的配置方法
mmseg4j-solr-2.3.0.jar 支持 solr5.x 版本以上 分词器本身并未做升级还是mmseg4j-core-1.10.0 和 mmseg4j-analysis-1.9.1.jar为了方便也一并上传
该分词器支持solr7.x
最近因为工作的需要,要做一个分词器,通过查找相关的资料最终用solr实现了,下面这篇文章主要给大家介绍了关于Solr通过特殊字符分词实现自定义分词器的相关资料,需要的朋友可以参考借鉴,下面随着小编来一起看看吧...
solr 源码 + IK 分词器 + zookeeper。