召回率:Recall,又称“查全率”;
准确率:Precision,又称“精度”、“正确率”。
在一个大规模数据集合中检索文档时,可把集合中的所有文档分成四类:
A:检索到的,相关的 (搜到的也想要的)
B:检索到的,但是不相关的 (搜到的但没用的)
C:未检索到的,但却是相关的 (没搜到,然而实际上想要的)
D:未检索到的,也不相关的 (没搜到也没用的)
通常我们希望:数据库中相关的文档,被检索到的越多越好,这是追求“查全率”,即A/(A+C),越大越好。
同时我们还希望:检索到的文档中,相关的越多越好,不相关的越少越好,这是追求“准确率”,即A/(A+B),越大越好。
归纳如下:
召回率:检索到的相关文档 比 库中所有的相关文档
准确率:检索到的相关文档 比 所有被检索到的文档
“召回率”与“准确率”虽然没有必然的关系(从上面公式中可以看到),然而在大规模数据集合中,这两个指标却是相互制约的。
由于“检索策略”并不完美,希望更多相关的文档被检索到时,放宽“检索策略”时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
而希望去除检索结果中的不相关文档时,务必要将“检索策略”定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响。
凡是设计到大规模数据集合的检索和选取,都涉及到“召回率”和“准确率”这两个指标。而由于两个指标相互制约,我们通常也会根据需要为“检索策略”选择一个合适的度,不能太严格也不能太松,寻求在召回率和准确率中间的一个平衡点。这个平衡点由具体需求决定。
其实,准确率(precision,精度)比较好理解。往往难以迅速反应的是“召回率”。我想这与字面意思也有关系,从“召回”的字面意思不能直接看到其意义。
我觉得“召回率”这个词翻译的不够好。“召回”在中文的意思是:把xx调回来。比如sony电池有问题,厂家召回。
既然说翻译的不好,我们回头看“召回率”对应的英文“recall”,recall除了有上面说到的“order sth to return”的意思之外,还有“remember”的意思。
Recall:the ability to remember sth. that you have learned or sth. that has happened in the past.
这里,recall应该是这个意思,这样就更容易理解“召回率”的意思了。
当我们问检索系统某一件事的所有细节时(输入检索query),Recall就是指:检索系统能“回忆”起那些事的多少细节,通俗来讲就是“回忆的能力”。能回忆起来的细节数 除以 系统知道这件事的所有细节,就是“记忆率”,也就是recall——召回率。
分享到:
相关推荐
只考虑Accuracy和AUC的调参方式是错误的;尤其是在不均衡样本时候,必须考虑精确率和召回率,本文采用基于遗传算法思想的调参方式,大概率来获得全局最优解
matplotlib.pyplot绘制决策树的准确率,召回率,ROC,特征重要性-附件资源
下面就说说怎么计算准确率以及误判率、召回率等指标 1.计算正确率 获取每批次的预判正确个数 train_correct = (pred == batch_y.squeeze(1)).sum() 该语句的意思是 预测的标签与实际标签相等的总数 获取训练集总的...
混淆矩阵、准确率、精确率、召回率、F值、ROC曲线、AUC、PR曲线-Sklearn.metrics评估方法 - 简书.mhtml
计算两幅图像的交叉率,精确率,召回率,可用于比较算法标记和手工标记的两幅二值化图像。
大家好,这个资源是关于机器学习_深度学习 的常见评估方法,例如混淆矩阵、正确率、精确率、召回率、F值、预测概率、ROC曲线和AUC | 均方误差、决定系数、SVR | 超参数的设置 | 模型的过拟合与防止等方法,包含完整...
图像分割实验常用matlab代码供参考;包括准确率、召回率等的计算代码
召回率和精确率 召回率-精确率曲线 TREC项目 208 万维网搜索(World Wide Web Searching) 其他有效性评价方法 4.6 余弦法实现 文档内频率 余弦值的计算方法 文档权重所需的内存 累加器内存 快速查询处理 按频率排序...
已知混淆矩阵情况下,python计算第二类精确率召回率F1得分及总体精度kappa系数。
分类阙值真与假以及正类别与负类别准确率、精确率和召回率准确率精确率召回率精确率和召回率的关系ROC曲线和AUCROCAUC 阙值 如果某个逻辑回归模型对某封电子邮件进行预测时返回的概率为 0.9995,则表示该模型预测这...
精确率 召回率 F-值 结巴分词 84.6% 73.6% 78.7% 斯坦福分词器 75.5% 71.0% 73.2% 北大 PKUNLP(训练后) 94.3% 94.3% 94.2% 自研方法 96.4% 97.1% 96.7% 基于大数据的中医智能辅助系统全文共20页,当前为第9页。...
在已知混淆矩阵情况下,python计算其中第二类的精确率召回率F1得分总体精度kappa系数。(jupyter notebook下完成)
准确率和召回率matlab代码SPBL_Pytorch PyTorch实施“用于临床皮肤病识别的自动平衡学习” 安装 该项目基于和。 并且我们在其中添加了不平衡的学习方法,并修改了一些代码以实现兼容性。 要求 Python 3.4以上 ...
计算常见的分类器衡量指标,包括真阳性,真阴性,假阳性,假阴性,准确率,错误率,特异度和F值
语义精确度和召回率,用于评估不连贯的本体映射
召回率和精度问题UTA7统计分析 该存储库旨在为我们对中的问题的统计分析收集一套 。 为了这个目的,我们正在计算代表我们的(或)的几个热图。 简而言之,是对分类问题的预测结果的简短描述。 在我们的,我们正在为...
机器学习 深度学习 pytorch tensorflow 贝叶斯 神经网络 算法
该函数将根据您的输入(实际和预测)返回结果(准确度、召回率、精度、F1、F2、F0.5)。 例如, 加载fisheriris X = 测量值; Y = 物种; Mdl = fitcknn(X,Y,'NumNeighbors',5,'Standardize',1); 预测Y = ...
基于Bayes分析的空管安全概率评估方法,廖勇,郭九霞,以空管安全为研究对象,旨在建立一套关于空管安全的概率评估方法。首先从数学的角度,将空管不安全事件进行了概率化表示;然后,
使用python绘制雷达图 部分代码展示 import numpy as np import matplotlib.pyplot as plt # 解决中文显示问题 ... {"准确率": 0.89, "精确率": 0.82, "召回率": 0.61, "F1": 0.70 ,'AUC':0.7381},