bag-similarity是相似性的一种,比如有两个bags{a,a,a,b}和{a,a,b,b,c},它们的bag-similarity就是1/3,在交集中,a出现2次,b出现一次,所以它的大小是3。两个bags的并的大小为两个bags的大小的和,在这个例子中是9.
用r很容易的实现这个相似性的计算。
a<-c('a','a','a','b')
b<-c('a','a','b','b','c')
bb<-function(a,b){
g<-intersect(a,b)
g<-paste(g,sep="")
xx<-0
for (i in g){
xx=xx+min(table(a)[i],table(b)[i])
}
xx/(length(a)+length(b))
}
bb(a,b)
require 'set'
s1=%w{a a a b}
s2=%w{a a b b c}
def bag_sim(s1,s2)
g=s1.to_set & s2.to_set
m=0
g.each do |i|
a=s1.count(i)
b=s2.count(i)
m+=(a>b)?b:a
end
m/(s1.size+s2.size).to_f
end
puts bag_sim(a,b)
分享到:
相关推荐
local self-similarity descriptor matlab code
各种字符串相似度和距离算法的实现:Levenshtein,Jaro-winkler,n-Gram,Q-Gram,Jaccard索引,最长公共子序列编辑距离,余弦相似度......
java-string-similarity, 各种字符串相似性和距离算法 java-string-similarity 实现不同字符串相似度和距离度量的库。 目前已经实现了许多算法( 包括Levenshtein编辑距离和 sibblings,jaro winkler,最长公共子序列...
acoustic similarity between any two instants of an audio recording is displayed in a static 2D repre- sentation, which makes structural and rhythmic characteristics visible. Unlike practically all ...
similarity cosine ontology
例如最直观的对比损失(Contrastive loss),它希望正样本对(或同类样本对)越近越好,负样本对之间至少要有大于某个给定的距离,具体而言可以表示为:其
基于pytorch的人脸识别用Siamese网络实现,带原始数据 Facial-Similarity-with-Siamese-Networks-in-Pytorch
Algorithm-python-string-similarity.zip,使用python实现不同字符串相似性和距离度量的库。,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
前端开源库-similarity相似性,这两个字符串有多相似?
posenet-similarity基于PoseNet算法识别两张图片中的姿势相似度
分型算法 Self-similarity of complex networks Nature 443
Algorithm-java-string-similarity.zip,各种字符串相似度和距离算法的实现:levenshtein、jaro winkler、n-gram、q-gram、jaccard索引、最长公共子序列编辑距离、余弦相似度……,算法是为计算机程序高效、彻底地完成...
资源来自pypi官网。 资源全名:html-similarity-0.3.2.tar.gz
,用于计算两个字符串之间的归一化距离或相似度分数。 0.0 分表示两个字符串绝对不相似,1.0 表示绝对相似(或相等)。 介于两者之间的任何内容都表示两个字符串的相似程度。例子在这个简单的例子中,我们想要计算...
pip install image-similarity-measures 为了更快地评估FSIM指标,需要使用pyfftw软件包。 您可以单独安装它,也可以通过额外的speedups安装: pip install image-similarity-measures[speedups] 您也可以安装...
此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。计算完成之后,再求海明距离,得到最终的相似度。
text-similarity-php, 通过余弦定理 分词计算文本相似度PHP版
ExtremeLearningMachine资源共享-Semi-supervised-spectral-hashing-for-fast-similarity-sear_2013_Neurocomputin.pdf 小弟准备学习ELM,才收集到一些相关资料,发现论坛中并无相关资料,因此把自己手头上收集到...
K-Similarity降噪的LSTM神经网络水质多因子预测模型.pdf
jar包,亲测可用