`
韩悠悠
  • 浏览: 827662 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

机器学习的算法衡量指标

阅读更多

 

选择合适的指标
在构建机器学习模型时,我们首先要选择性能指标,然后测试模型的表现如何。相关的指标有多个,具体取决于我们要尝试解决的问题。
在可以选择性能指标之前,首先务必要认识到,机器学习研究的是如何学习根据数据进行预测。对于本课程和后续的“监督式机器学习”课程,我们将重点关注那些创建分类或创建预测回归类型的已标记数据。
此外,在测试模型时,也务必要将数据集分解为训练数据和测试数据。如果不区分训练数据集和测试数据集,则在评估模型时会遇到问题,因为它已经看到了所有数据。我们需要的是独立的数据集,以确认模型可以很好地泛化,而不只是泛化到训练样本。在下一课中,我们将探讨模型误差的一些常见来源,并介绍如何正确分解本课程的“数据建模和验证”部分中的数据集。
 
 
 
分类和回归
分类涉及到根据未见过的样本进行预测,并确定新实例属于哪个类别。例如,可以根据蓝色或红色或者方形或圆形来组织对象,以便在看到新对象时根据其特征来组织对象。
在回归中,我们想根据连续数据来进行预测。例如,我们有包含不同人员的身高、年龄和性别的列表,并想预测他们的体重。或者,像在本课程的最终项目中一样,我们可能有一些房屋数据,并想预测某所住宅的价值。
手头的问题在很大程度上决定着我们如何评估模型。
 
 
分类指标与回归指标
在分类中,我们想了解模型隔多久正确或不正确地识别新样本一次。而在回归中,我们可能更关注模型的预测值与真正值之间差多少。
在本节课的余下部分,我们会探讨几个性能指标。对于分类,我们会探讨准确率、精确率、召回率和 F 分数。对于回归,我们会探讨平均绝对误差和均方误差
 
 
分类指标
对于分类,我们处理的是根据离散数据进行预测的模型。这就是说,此类模型确定新实例是否属于给定的一组类别。在这里,我们测量预测是否准确地将所讨论的实例进行分类。
 
 
准确率
最基本和最常见的分类指标就是准确率。在这里,准确率被描述为在特定类的所有项中正确分类或标记的项的数量。
举例而言,如果教室里有 15 个男孩和 16 个女孩,人脸识别软件能否正确识别所有男孩和所有女孩?如果此软件能识别 10 个男孩和 8 个女孩,则它识别男孩和女孩的准确率分别为 66% 和 50%:
准确率 = 正确识别的实例的数量/所有实例数量
有关准确率和如何在 sklearn 中使用它的更多信息,请查看此链接 此处
 
 
 
 
F1 分数
既然我们已讨论了精确率和召回率,接下来可能要考虑的另一个指标是 F1 分数。F1 分数会同时考虑精确率和召回率,以便计算新的分数。
可将 F1 分数理解为精确率和召回率的加权平均值,其中 F1 分数的最佳值为 1、最差值为 0:
F1 = 2 * (精确率 * 召回率) / (精确率 + 召回率)
有关 F1 分数和如何在 sklearn 中使用它的更多信息,请查看此链接此处
 
 
 
回归指标
正如前面对问题的回归类型所做的介绍,我们处理的是根据连续数据进行预测的模型。在这里,我们更关注预测的接近程度。
例如,对于身高和体重预测,我们不是很关心模型能否将某人的体重 100% 准确地预测到小于零点几磅,但可能很关心模型如何能始终进行接近的预测(可能与个人的真实体重相差 3-4 磅)。
 
 
平均绝对误差
您可能已回想起,在统计学中可以使用绝对误差来测量误差,以找出预测值与真实值之间的差距。平均绝对误差的计算方法是,将各个样本的绝对误差汇总,然后根据数据点数量求出平均误差。通过将模型的所有绝对值加起来,可以避免因预测值比真实值过高或过低而抵销误差,并能获得用于评估模型的整体误差指标。
有关平均绝对误差和如何在 sklearn 中使用它的更多信息,请查看此链接此处
 
 
均方误差
均方误差是另一个经常用于测量模型性能的指标。与绝对误差相比,残差(预测值与真实值的差值)被求平方。
对残差求平方的一些好处是,自动将所有误差转换为正数、注重较大的误差而不是较小的误差以及在微积分中是可微的(可让我们找到最小值和最大值)。
有关均方误差和如何在 sklearn 中使用它的更多信息,请查看此链接此处
 
 
 
回归分数函数
除了误差指标之外,scikit-learn还包括了两个分数指标,范围通常从0到1,值0为坏,而值1为最好的表现。
虽然在课程最后的项目中,我们不会用到这两个指标,但是需要知道他们很重要。他们还有一个优点,就是看起来和分类指标类似,都是数字越接近1.0分数就越好。
其中之一是R2分数,用来计算真值预测的可决系数。在 scikit-learn 里,这也是回归学习器默认的分数方法。
另一个是可释方差分数
虽然眼下我们不会详细探讨这些指标,一个要记住的重点是,回归的默认指标是“分数越高越好”;即,越高的分数表明越好的表现。而当我们用到前面讲的误差指标时,我们要改变这个设定。
 
分享到:
评论

相关推荐

    2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课

    从基本的软件安装到必备的Python扩展讲起,然后对机器学习算法一一讲解,同时配合编程实操的实现过程,适合零基础系统学习,配套资料包括讲义作业软件数据都有。 课程目录: 第一章Numpy前导介绍 1.1、Anconda安装 ...

    人工智能大作业基于机器学习的房价和二手房房价预测(数据集+项目源码+文档资料).zip

    项目介绍: 该项目的目标是通过分析某地区的房地产数据,预测房地产的价值。我们将收集该地区的房地产数据...如果模型的性能不理想,我们将尝试调整模型的参数或使用其他的机器学习算法来进行优化。 预测与可视化:在

    论文研究-基于卷积神经网络和注意力模型的文本情感分析.pdf

    针对社交网络数据的文本情感分析,目前常用的研究方法主要是基于传统机器学习算法,根据手工标注好的情感词典,对文本信息使用朴素贝叶斯、支持向量机、最大熵方法等机器学习算法进行情感分析。为了避免对手工方式...

    超强大的Python数据分析课程-偏机器学习方向 Python数据分析经典案例课程 [复制链接]

    ├─机器学习经典案例.zip ├─课时01.课程简介.flv ├─课时02.课程数据,代码下载.swf ├─课时03.使用Anaconda搭建python环境.flv ├─课时04.Kobe.Bryan生涯数据读取与简介.flv ├─课时05.特征数据可视化展示....

    matlab的egde源代码-MachineLearning:Matlab/Octave中机器学习算法的实现

    导航到特定文件夹(使它们变得非常特定),然后查看该特定文件夹的README.md文件(要针对哪个文件夹运行),以查看有关机器学习算法可以为您执行的示例。 享受! 此存储库中的每个文件/文件夹用于什么目的: -...

    一阶分布式在线优化算法与分布式对偶平均算法的收敛速度对比.pdf

    为提高分布式在线优化算法的收敛速度,对...作为衡量在线优化算法性能的一个重要指标,Regret界刻画了随时间推移的累积成本与最佳固定决策所产生的成奉之间的差值,因此在线优化算法的优劣可由Regret界的大小进行判断。

    衡量创新方向:无辅助机器学习的前沿工具-研究论文

    我们将我们的算法应用于 2000-2018 年期间 USPTO 专利摘要的语料库,并证明,相对于 USPTO 专利类别的分类,我们的算法提供了创新主题转移的领先指标,并能够更精确地分析想法空间。 使用此类措施很重要,因为它...

    分布式算法 作者:(美)Nancy A.Lynch 舒继武 李国东part1

    这些算法都根据精确定义的复杂度衡量方法进行分析。本书还讲述针对许多典型问题的算法、各类系统模型及其能力。章后提供大量习题并列出了详细的参考文献。  本书可作为高等院校计算机系研究生的教材,尤其适合对...

    一种基于模型的强化学习算法 (2008年)

    收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环境模型的学习引入到强化学习过程中,...

    论文研究-基于相异度核空间的支持向量机算法.pdf

    论文研究-基于相异度核空间的支持... 在仿真实验中,采用UCI机器学习数据库上标准分类数据集为样本. 对比构造的相异度核空间与常用核函数如线性核、多项式核、高斯核在支持向量机分类时的 分类精度来验证有效性和优越性.

    披露情绪:机器学习与字典方法-研究论文

    具体来说,机器学习衡量标准解释了 10-K 申请日期的回报,而基于 Loughran 和 McDonald 字典的衡量标准仅解释了他们研究期间的 10-K 申请日期的回报。 此外,在电话会议期间,机器学习方法对 Loughran 和 McDonald ...

    使用机器学习技术预测高频股票价格-研究论文

    本文解决了基于机器学习方法使用高频数据预测股票价格的问题。 我们在本文中研究了两件事(1)在寻找最佳样本内经验损失最小化器的过程中,根据所提出的评估措施,比较具有给定回溯参数的所选函数类之间的预测性能...

    pyDML:Python的距离度量学习算法

    许多机器学习算法需要相似性度量来执行其任务。 通常,使用标准距离(如欧氏距离)来衡量这种相似性。 距离度量学习算法尝试从数据中学习最佳距离。如何学习距离? 在距离度量学习中,有两种主要的学习距离的方法:...

    使用机器学习选择导演-研究论文

    在随后的选举中使用股东对个别董事的支持和公司盈利能力作为绩效衡量标准,我们构建算法对这些董事绩效衡量标准进行样本外预测。 然后,我们对这些预测的质量进行了测试,并表明,与实际的潜在候选人库相比,我们的...

    a3-marcotcr-shrainik-bdol:了解 NLP 的机器学习

    很多人盲目使用机器学习算法,只看汇总统计(即准确率)。 我们制作了一个交互式可视化,让用户更好地了解他们的算法实际在做什么。 作为测试用例,我们选择了的子集,这是一个标准数据集,任务是学习区分不同的新闻...

    MSET算法原理

    MSET是由Singer等提出的一种非线性的多元预测诊断技术,是一种通过分析对比实际监测参数与设备正常运行时的健康数据为基础,对正常运行时的各个参数进行运算并做出估计,以这种正常的状态估计作为标准。当得到实际的...

    price-optimization:算法数据科学系列

    材料将涵盖: Mercari 的价格建议:如何使用机器学习给出恒定的价格建议使用市场数据价格推荐的机器学习工作流程衡量预测的好坏的指标评估动态价格优化使用零售需求数据需求估计的线性回归技术具有线性规划的多个...

    9.模型评估1

    1. 为了评估机器学习算法的能力,必须给定其性能的衡量指标 2. 有些情况下,很难决定衡量指标是什么: 3. 通常利用最小化训练误差来训练模型,但是真正关心的是

    A Hands-On Introduction to Math, Stats, and Machine Learning.pdf

    这些统计概念衡量机器学习模型的准确性。另外,在编写代码之前,在选择ML算法之前,它们通常是查看数据集的第一步。 基础代数和相关。这是对数据之间关系的研究。只有当数据呈正相关时,才能构建预测模型,因此...

    基于python的电影个性化推荐系统.zip

    接下来,我们将使用机器学习算法(如协同过滤、基于内容的推荐和深度学习)来训练模型。这些算法将根据用户的历史行为和喜好,为用户推荐可能感兴趣的电影。例如,协同过滤算法会根据其他用户对电影的评分和观看记录,...

Global site tag (gtag.js) - Google Analytics