相似度
相似度算法
余弦相似度算法
余弦相似度是通过两个向量的夹角度数来衡量相似程度。余弦相似度充分利用了余弦定理。余弦定理在三角形图论中有阐述。
余弦
余弦定理在直角三角形中的描述。这个是最简单的情况。
a和c的夹角为,其余弦值计算公式为:
如果不是直角三角形,如下:
这个公式也可以从上面的公式推导出来
所以
如果将上面的三角形放在二维坐标系中,上面的a表示坐标点(x2,y2)到原点的距离,b表示坐标点(x1,y1)到原点的距离,c表示坐标点(x1,y1)到坐标点(x2,y2)的距离。
根据前面的推导:
所以:
头部
<1 byte,E,><1 byte,S,><4 bytes,,消息大小><8 bytes,,请求Id><1 byte,,状态><4 bytes,,版本><n bytes,,body>
body
压缩
<4 bytes,,压缩算法><n bytes,,action><n bytes,,请求内容>
不压缩
BytesTransportRequest请求
<n bytes,,action><n bytes,,请求头><n bytes,,请求内容字节长度><n bytes,,请求内容>
非BytesTransportRequest请求
<n bytes,,action><n bytes,,请求内容>
压缩算法
<1 byte,D,><1 byte,F,><1 byte,L,><1 byte,\0,>
action
如:indices:data/read/search
请求头
<1 byte,0,请求头标识>
<1 byte,1,请求头标识><n bytes,,请求头信息>
请求内容
<n bytes,,请求内容字节数据>
如:org.elasticsearch.action.search.SearchRequest
相关推荐
Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...
(狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战),包含了小狂神讲的东西,特别适合新手学习,笔记保存下来可以多看看。好记性不如烂笔头哦~,ElasticSearch,简称es,es是一个...
es-head是一个针对Elasticsearch的可视化操作插件。它提供了一个便捷的操作工具,可以连接Elasticsearch搜索引擎,并提供可视化的操作页面,对Elasticsearch进行各种设置和数据检索功能的管理。 es-head 插件可以在...
Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...
Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于大数据领域的全文检索。它以其高可扩展性、实时性能以及丰富的分析能力著称。在中文环境下,由于汉字的复杂性,分词是实现有效搜索的关键步骤。为此,...
在IT领域,尤其是在搜索引擎优化和大数据分析中,Elasticsearch(ES)是一个广泛使用的开源全文检索引擎。它基于Lucene库,提供了分布式、实时、高可用性以及容错能力的数据存储和搜索解决方案。本篇文章将重点讲解...