最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到,知道意思,但是有时候要很清晰地向同学介绍则有点转不过弯来。
召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。
召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义。
准确率:Precision,又称“精度”、“正确率”。
以检索为例,可以把搜索情况用下图表示:
相关
|
不相关
|
|
检索到
|
A
|
B
|
未检索到
|
C
|
D
|
A:检索到的,相关的 (搜到的也想要的)
B:检索到的,但是不相关的 (搜到的但没用的)
C:未检索到的,但却是相关的 (没搜到,然而实际上想要的)
D:未检索到的,也不相关的 (没搜到也没用的)
如果我们希望:被检索到的内容越多越好,这是追求“查全率”,即A/(A+C),越大越好。
如果我们希望:检索到的文档中,真正想要的、也就是相关的越多越好,不相关的越少越好,这是追求“准确率”,即A/(A+B),越大越好。
“召回率”与“准确率”虽然没有必然的关系(从上面公式中可以看到),在实际应用中,是相互制约的。要根据实际需求,找到一个平衡点。
往往难以迅速反应的是“召回率”。我想这与字面意思也有关系,从“召回”的字面意思不能直接看到其意义。“召回”在中文的意思是:把xx调回来。“召回率”对应的英文“recall”,recall除了有上面说到的“order sth to return”的意思之外,还有“remember”的意思。
Recall:the ability to remember sth. that you have learned or sth. that has happened in thepast.
当我们问检索系统某一件事的所有细节时(输入检索query查询词),Recall指:检索系统能“回忆”起那些事的多少细节,通俗来讲就是“回忆的能力”。“能回忆起来的细节数” 除以 “系统知道这件事的所有细节”,就是“记忆率”,也就是recall——召回率。简单的,也可以理解为查全率。
相关推荐
1. 正确率 = 提取出的正确信息条数 / 提取出的信息条数 2. 召回率 = 提取出的正确信息条数 / 样本中的信息条数 3. F值 = 正确率 * 召回率
Caffe-SSD的solver.cpp修改后的源码,可输出准确率、召回率和PR曲线值
1.项目基于Python的垃圾短信识别程序,通过 KNN、逻辑回归、随机森林、决策树和 朴素贝叶斯等算法进行融合,实现判别提高准确率,并进行测试和应用。...综合召回率与准确率,两种朴素贝叶斯的结果比较理想。
针对移动网络中用户的移动、数据丢失、用户定位不精确...详细的仿真实验以及与现有的基于距离的移动用户群挖掘算法DMUM的对比表明,该算法不仅具有更少的执行时间,同时有效地提高了移动用户群挖掘的召回率与准确率。
如何从大规模服务集合中快速而准确地发现目标服务是应用Web服务技术的关键。...仿真实验表明,其在召回率与准确率上比基于关键字的匹配算法都有不同程度的改善,且该方法能极大地满足服务执行时动态绑定的特性。
下面就说说怎么计算准确率以及误判率、召回率等指标 1.计算正确率 获取每批次的预判正确个数 train_correct = (pred == batch_y.squeeze(1)).sum() 该语句的意思是 预测的标签与实际标签相等的总数 获取训练集总的...
针对车辆牌照字符这一特殊场景文本的提取,提出一种压缩域文本提取算法,它集文本区域检测、定位、跟踪和字符识别等...实验表明了算法的有效性,召回率与准确率分别可达95%与96.2%,该算法也适用于其他类型文本的提取。
计算常见的分类器衡量指标,包括真阳性,真阴性,假阳性,假阴性,准确率,错误率,特异度和F值
准确率和召回率matlab代码SPBL_Pytorch PyTorch实施“用于临床皮肤病识别的自动平衡学习” 安装 该项目基于和。 并且我们在其中添加了不平衡的学习方法,并修改了一些代码以实现兼容性。 要求 Python 3.4以上 ...
matplotlib.pyplot绘制决策树的准确率,召回率,ROC,特征重要性-附件资源
图像分割实验常用matlab代码供参考;包括准确率、召回率等的计算代码
混淆矩阵、准确率、精确率、召回率、F值、ROC曲线、AUC、PR曲线-Sklearn.metrics评估方法 - 简书.mhtml
1、召回率:评价模型的完整性 预测样本中的预测正确的信息条数/总样本中所有的属于这类样本的信息条数 举例: 这里用鱼和虾举例 TP: ...准确率 = (TP+TN)/(TP+FP+FN+TN) 3、F1分数: F1分数可以看作模型的
机器学习在提升性能测试准确性和召回率的应用和思考—杨硕1
通常,我们认为精度和召回率都表明模型的准确性。 尽管这是正确的,但每个术语都有更深层的,不同的含义。 精确度是指相关结果的百分比。 另一方面,召回指的是您的算法正确分类的所有相关结果的百分比。 毫无疑问...
针对传统图书信息检索系统通过本地服务器提供信息检索,其检索速率与结果准确率低,且受本地计算设施性能影响较大等问题,文中...实验与测试结果表明,本检索系统的召回率与准确率较传统检索系统分别提高了22%与18%。
使用混淆矩阵评价性能,输出识别率,召回率以及F1 %数据输入 svm_models = svmtrain(Ttrain,Ptrain,cmd); [y,error1] = svmpredict(Ttest,Ptest,svm_models); [A,~]= confusionmat(Ttest,y); 4.注意事项:注意...
评估师 在mahout原始码之上,并至少提供了更好的封装,提供评估器功能,包括准确率,召回率等评估方法。