`
lobin
  • 浏览: 379279 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

elasticsearch

 
阅读更多

 

相似度

相似度算法

 

余弦相似度算法

余弦相似度是通过两个向量的夹角度数来衡量相似程度。余弦相似度充分利用了余弦定理。余弦定理在三角形图论中有阐述。

 

余弦

余弦定理在直角三角形中的描述。这个是最简单的情况。

a和c的夹角为,其余弦值计算公式为:

 

如果不是直角三角形,如下: 

这个公式也可以从上面的公式推导出来

所以

 

 

如果将上面的三角形放在二维坐标系中,上面的a表示坐标点(x2,y2)到原点的距离,b表示坐标点(x1,y1)到原点的距离,c表示坐标点(x1,y1)到坐标点(x2,y2)的距离。

 

 

 

 

根据前面的推导:

 

所以:

 

 

 

 

 

 

 

 

 

头部

<1 byte,E,><1 byte,S,><4 bytes,,消息大小><8 bytes,,请求Id><1 byte,,状态><4 bytes,,版本><n bytes,,body>

body

压缩

<4 bytes,,压缩算法><n bytes,,action><n bytes,,请求内容>

不压缩

BytesTransportRequest请求

<n bytes,,action><n bytes,,请求头><n bytes,,请求内容字节长度><n bytes,,请求内容>

非BytesTransportRequest请求

<n bytes,,action><n bytes,,请求内容>

压缩算法

<1 byte,D,><1 byte,F,><1 byte,L,><1 byte,\0,>

action

如:indices:data/read/search

请求头

<1 byte,0,请求头标识>

<1 byte,1,请求头标识><n bytes,,请求头信息>

请求内容

<n bytes,,请求内容字节数据>

如:org.elasticsearch.action.search.SearchRequest

 

 

 

0
0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics