原文链接:http://blog.csdn.net/dm_vincent/article/details/41743955
match查询是如何使用bool查询的
现在,你也许意识到了使用了match
查询的多词查询只是简单地将生成的term
查询包含在了一个bool
查询中。通过默认的or
操作符,每个term
查询都以一个语句被添加,所以至少一个should
语句需要被匹配。以下两个查询是等价的:
{
"match": { "title": "brown fox"}
}
{
"bool": {
"should": [
{ "term": { "title": "brown" }},
{ "term": { "title": "fox" }}
]
}
}
使用and
操作符时,所有的term
查询都以must
语句被添加,因此所有的查询都需要匹配。以下两个查询是等价的:
{
"match": {
"title": {
"query": "brown fox",
"operator": "and"
}
}
}
{
"bool": {
"must": [
{ "term": { "title": "brown" }},
{ "term": { "title": "fox" }}
]
}
}
如果指定了minimum_should_match
参数,它会直接被传入到bool
查询中,因此下面两个查询是等价的:
{
"match": {
"title": {
"query": "quick brown fox",
"minimum_should_match": "75%"
}
}
}
{
"bool": {
"should": [
{ "term": { "title": "brown" }},
{ "term": { "title": "fox" }},
{ "term": { "title": "quick" }}
],
"minimum_should_match": 2
}
}
因为只有3个查询语句,minimum_should_match
的值75%
会被向下舍入到2
。即至少两个should语句需要匹配。
当然,我们可以通过match
查询来编写这类查询,但是理解match
查询的内部工作原理能够让你根据需要来控制该过程。有些行为无法通过一个match
查询完成,比如对部分查询词条给予更多的权重。在下一节中我们会看到一个例子。
提升查询子句(Boosting Query Clause)
当然,bool
查询并不是只能合并简单的单词(One-word)match
查询。它能够合并任何其它的查询,包括其它的bool
查询。它通常被用来通过合并数个单独的查询的分值来调优每份文档的相关度_score
。
假设我们需要搜索和"full-text search"相关的文档,但是我们想要给予那些提到了"Elasticsearch"或者"Lucene"的文档更多权重。更多权重的意思是,对于提到了"Elasticsearch"或者"Lucene"的文档,它们的相关度_score
会更高,即它们会出现在结果列表的前面。
一个简单的bool查询能够让我们表达较为复杂的逻辑:
GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"content": {
"query": "full text search",
"operator": "and"
}
}
},
"should": [
{ "match": { "content": "Elasticsearch" }},
{ "match": { "content": "Lucene" }}
]
}
}
}
-
content
字段必须含有full
,text
和search
这三个词条 - 如果
content
字段也含有了词条Elasticsearch
或者Lucene
,那么该文档会有一个较高的_score
should
查询子句的匹配数量越多,那么文档的相关度就越高。目前为止还不错。
但是如果我们想给含有Lucene
的文档多一些权重,同时给含有Elasticsearch
的文档更多一些权重呢?
我们可以通过指定一个boost
值来控制每个查询子句的相对权重,该值默认为1
。一个大于1
的boost
会增加该查询子句的相对权重。因此我们可以将上述查询重写如下:
GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"content": {
"query": "full text search",
"operator": "and"
}
}
},
"should": [
{ "match": {
"content": {
"query": "Elasticsearch",
"boost": 3
}
}},
{ "match": {
"content": {
"query": "Lucene",
"boost": 2
}
}}
]
}
}
}
NOTE
boost
参数被用来增加一个子句的相对权重(当boost
大于1
时),或者减小相对权重(当boost
介于0
到1
时),但是增加或者减小不是线性的。换言之,boost
设为2
并不会让最终的_score
加倍。相反,新的
_score
会在适用了boost
后被归一化(Normalized)。每种查询都有自己的归一化算法(Normalization Algorithm),算法的细节超出了本书的讨论范围。但是能够说一个高的boost
值会产生一个高的_score
。如果你在实现你自己的不基于TF/IDF的相关度分值模型并且你需要对提升过程拥有更多的控制,你可以使用
function_score
查询,它不通过归一化步骤对文档的boost
进行操作。
在下一章中,我们会介绍其它的用于合并查询的方法,多字段查询(Multifield Search)。但是,首先让我们看看查询的另一个重要特定:文本分析(Text Analysis)。
相关推荐
elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点: 中文分词:elasticsearch-analysis-ik 是基于...
最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip
赠送jar包:elasticsearch-x-content-6.3.0.jar; 赠送原API文档:elasticsearch-x-content-6.3.0-javadoc.jar; 赠送源代码:elasticsearch-x-content-6.3.0-sources.jar; 赠送Maven依赖信息文件:elasticsearch-x...
赠送jar包:elasticsearch-rest-client-6.8.3.jar; 赠送原API文档:elasticsearch-rest-client-6.8.3-javadoc.jar; 赠送源代码:elasticsearch-rest-client-6.8.3-sources.jar; 赠送Maven依赖信息文件:elastic...
Elasticsearch(elasticsearch-8.2.0-aarch64.rpm),适用于Linux arm x86_64:它是一个高度可扩展的开源全文本搜索和分析引擎。它使您可以快速,近乎实时地存储,搜索和分析大量数据。它通常用作支持具有复杂搜索...
最新版windows elasticsearch-8.8.2-windows-x86_64.zip最新版windows elasticsearch-8.8.2-windows-x86_64.zip最新版windows elasticsearch-8.8.2-windows-x86_64.zip最新版windows elasticsearch-8.8.2-windows-...
Elasticsearch(elasticsearch-8.2.0-windows-x86_64.zip),适用于Windows x86_64:它是一个高度可扩展的开源全文本搜索和分析引擎。它使您可以快速,近乎实时地存储,搜索和分析大量数据。它通常用作支持具有复杂...
elasticsearch-analysis-ik-7.17.0
Elasticsearch(elasticsearch-8.2.0-linux-x86_64.tar.gz),适用于Linux x86_64 :它是一个高度可扩展的开源全文本搜索和分析引擎。它使您可以快速,近乎实时地存储,搜索和分析大量数据。它通常用作支持具有复杂...
最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip
elasticsearch-analysis-ik-7.14.0-c.zip elasticsearch-analysis-ik-7.14.0-c.zip elasticsearch-analysis-ik-7.14.0-c.zip
kettle 支持elasticsearch7.x 批量上传的插件,减压后放到data-integration\plugins 目录下即可
elasticsearch-analysis-ik-7.4.2,es7.4.2 ik分词
最新版 elasticsearch-analysis-ik-7.10.2.zip最新版 elasticsearch-analysis-ik-7.10.2.zip
ETL工具kettle7.1抽取数据目前不支持elasticsearch 2.X以上版本,如果想要支持elasticsearch 6.X以上版本,必须替换elasticsearch-bulk-insert-plugin插件,该资源提供该插件的替换。 具体步骤为在spoon kettle\data-...
赠送jar包:elasticsearch-x-content-6.3.0.jar; 赠送原API文档:elasticsearch-x-content-6.3.0-javadoc.jar; 赠送源代码:elasticsearch-x-content-6.3.0-sources.jar; 赠送Maven依赖信息文件:elasticsearch-x...
elasticsearch-analysis-ik-7.4.0
elasticsearch-8.11.0的分词器,配合es同版本使用,有粗粒度和细粒度分词
elasticsearch-repository-oss-6.7.0, elasticsearch-repository-oss-6.7.2从oss恢复es快照到集群插件。
ElasticSearch之插件Delete-by-Query,当es想批量删除数据时,安装该插件,可用将查询的结果数据进行批量删除。