- 浏览: 2596874 次
- 来自: 杭州
文章分类
- 全部博客 (1190)
- webwork (4)
- 网摘 (18)
- java (104)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (15)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (8)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
Aqu415:
,默认是netty还是hassion?
dubbo入门 -
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介
作用
函数查询的作用,是影响计算score的算法,并不替换,只是影响。普通的计算score的方法是lucene本身的算法。
描述如下:
A function query allows you to introduce a component of the score that is computed,
based on a mathematical expression of your choice involving indexed field value(s).
This is not a replacement for Lucene's scoring algorithm, but it basically adds to the
existing score.
可见 函数查询 这个名字并不好,如 《Solr 1.4 Enterprise Search Server》中所述:
A bad name for this feature
The name of this feature is poor as it does not reflect what it does.
Perhaps Scoring Function
or even Score Query
might have been
bette
r. The reason for the name Function Query undoubtedly stems
from the manner in which the feature is implemented. It is implemented
as a Lucene Query type, albeit a very strange one that matches all of the
documents but scores them differently.
本质:
增加一个查询字段,值为函数计算所得。
可以简单这么理解 score += 函数计算结果
本来score是lucene根据字段的查询得到的,比如查询字符串 comments:套餐 lucene根据具体索引情况计算得到score值。
现在模拟一个字段,规定叫做_val_,这个字段的值就是跟随的函数计算的结果。
例子 comments:套餐 && _val_:"div(age,status)"
用法
用法wiki里有好几种,严格来说4种,详细请看wiki。
现在的刚刚发布solr3.1(同步了lucene的版本),这些功能我并没有用过。但1.4中的有些用法有bug。
可以的用法:
q=comments:套餐 && _val_:"div(age,status)"
注意函数就是一个表达式,所以函数也是可以嵌套的~
其他的,不再重复solr的wiki中的内容,仅仅贴出链接。
函数查询的中文翻译版(不太全):http://www.iteye.com/topic/352191
函数查询的wiki版(全而新) :http://wiki.apache.org/solr/FunctionQuery#Using_FunctionQuery
一个好例子,仔细看哦~~ :http://www.ibm.com/developerworks/cn/java/j-spatial/
发表评论
-
三种solr提交(commit)索引的方式
2014-03-01 13:40 20878三种solr提交索引的 ... -
solr build索引性能
2014-03-01 13:26 1514测试代码 package mytest; impo ... -
Solr性能优化之filterCache
2014-02-27 10:48 907原文:Solr性能优化之filterCache 什么是f ... -
SolrCore查询过程源码分析
2014-02-12 15:37 1220一.环境启动代码 SolrResourceLoader. ... -
通过设置SolrInputDocument 的boost来改变文档评分
2014-01-31 23:18 1500solr通过关键字查询后的文档得分最后要乘以这个boost因 ... -
Solr 使用 Log4j
2014-01-25 21:31 2365原文出处:http://blog.chenlb.com/20 ... -
solr基本概念
2014-01-25 20:49 1362原文:http://www.solrtutorial.com ... -
solr load比较高
2013-12-02 09:50 1027最近solr的load比较高,通过jstack查看: 写 ... -
Solr索引放入内存
2013-08-28 11:45 9996在一次技术群中,中听到一位sina的架构师,他们是采用基于l ... -
solr build索引遇到控制字符的错误
2013-08-23 15:12 601今天build solr 索引遇到如下错误: 发现提 ... -
solr 更新index的最佳实践
2013-08-22 15:24 985其中重要一点是,solr不运行并发commit。 懒得翻 ... -
Scaling Solr(Solr的扩展)
2013-08-21 20:55 663Solr 的扩展 (Scaling) 当你的索 ... -
Lucene Scoring 评分机制
2013-08-21 20:52 692Lucene 评分体系/机制 ... -
solr build index例子
2013-08-20 14:24 835p = PeopleDO({'userid':101,'s ... -
solr build索引时commit与optimize的概念
2013-08-20 14:22 1892大家都知道,solr在提交索引的时候有commit和opt ... -
solr in action
2013-08-20 13:56 1210solr in action电子书 -
solr java客户端build索引
2012-12-17 17:08 1040package com.duitang.views.tes ... -
Solr搜索的排序打分规则
2012-11-20 17:48 2393使用Solr搭建搜索引擎很容易,但是如何制定合理的打分规则(b ... -
Solrj
2012-11-20 14:17 919solr 的java客户端可比python复杂一些,贴点代码: ... -
solr cache使用和介绍
2012-07-23 18:49 0原文:http://wiki.apache.org ...
相关推荐
详细介绍了Elasticsearch 和 solr 的区别;是一道经典的java面试题
Solr_1.4_Enterprise_Search_Server.pdf
solr_3.5_配置及应用
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一...
官方推荐读物 Apache_solr_4_cookbook.pdf英文版
solr_5.0_tomcat7_IKAnalyzer中文分词安装步奏及demo演示, 步奏详细可用,配图
solr manageschema 配置文件,增加了分词器后的配置文件
此为solr8的ikanalyzer中文分词包
solr环境搭建所需lib 博客连接http://blog.csdn.net/x631617479/article/details/54232758
solr1.4源码(欢迎喜欢研究solr的人下载)
solr_lxml_示例演示 solr 和 lxml 的 python 代码支持:Mac osx。 Python2.7 & python3.2 lxml 和 yaml 只为 Python2.7 & python3.2 编译示例可执行代码位于:/solr_lxml_Example/server/core 当任何应用程序启动时...
solr
Solr in Action by Trey Grainger , Timothy Potter Book Description Publication Date: April 5, 2014 | ISBN-10: 1617291021 | ISBN-13: 978-1617291029 | Edition: 1 Summary Solr in Action is a ...
一个讲解solr配置和应用demo的文档
solrcloud部署;作者:家和一定万事兴; 参考文章:2014-02-19,于测试机器上部署solrcloud;
solr文档
solr functionquery函数查询功能强大,但字符串函数比较缺乏,该示例是contain示例,表示值中包含传入的字符串即返回1 否则返回0,可用于solr查询中如果某个字段包含动态传入的值在排名优先。有其他查询排序需求...
ik分词器源码,最新版本,支持solr8,及以下版本
solr6.x_IK中文分词工具,solr6.x_IK中文分词工具,solr6.x_IK中文分词工具
在solr使用 IKAnalyzer 分词时,自带的字典比较熟,不适合精确拆分。可以使用sougou分词,还是比较好用的。