`

机器学习1-基本概念

阅读更多

参考: https://www.jianshu.com/p/cbe8e0fe7b2c

 

 

数据集 

(色泽=青绿;根蒂=蜷缩;敲声=浊响)
(色泽=墨绿;根蒂=稍蜷;敲声=沉闷)
(色泽=浅白;根蒂=硬挺;敲声=清脆)
······

 

基本概念:

1、样本——这批数据里的每对括号。
2、数据集——样本的集合。
3、特征、属性——色泽、根蒂、敲声等反映事物的本质的可观察方面。
4、属性值——青旅、墨绿、蜷缩、浊响等,是属性的取值。
5、属性空间、样本空间、输入空间——属性张成的空间。把属性当作坐标轴,形成一个空间,那么样本就是这个空间中一个个的点。例如,吧“色泽”、“根蒂”、“敲声”作为坐标轴,则生成一个三维空间,每个西瓜都是这个空间里的一个点。
6、维数——数据集的特征数量。本例中的维数是3。
7、假设——也称假设函数,指计算机通过学习后得到的一个函数(预测模型)。
8、标记——关于样本结果的信息,比如一个(色泽=青绿;根蒂=蜷缩;敲声=浊响)的西瓜是好瓜,那么“好瓜”就是(色泽=青绿;根蒂=蜷缩;敲声=浊响)这个样本的标记。
9、样例——带有标记的样本,比如((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)
10、标记空间、输出空间——所有标记的集合。本例中就是指{好瓜、坏瓜}。
11、泛化——如果用某个数据集的样本训练出的一个模型(假设函数),能够适用于新的样本数据,就说这个模型具有泛化能力。模型能适用于越多的新数据,则说明其泛化能力越强。
12.假设空间----所有假设组成的空间,假设颜色有2种(深绿,浅绿),根蒂有2种(蜷缩,稍蜷),敲声有2种(浊响,沉闷),有可能好瓜与颜色无关,因此颜色有3种可能性(深绿,浅绿,无关),依次类推,根蒂,敲声都有3种可能性,共有3*3*3种可能, 还有可能好瓜这种假设根本不成立,因此一共有3*3*3+1种假设
推广: 假设一个事物有2个特征,每个特征的属性分别有x 种和y种,那么假设空间就有(x+1)*(y+1)+1种
 
13. 版本空间: 可能对于一个训练集,有多种假设都满足要求,这多种符合要求的假设构成了版本空间

分类 : 预测离散值,比如好瓜和坏瓜

回归:预测连续值,比如房价与面积的关系

 

归纳偏好: 算法对某种类型假设的偏好

 过拟合: 机器学习需要从训练集训练处一个模型,能够很好的应用于新的样本,当模型把训练集中的某些特征当做了普遍规律,很可能无法适用于新集合,就产生了过拟合

分享到:
评论

相关推荐

    机器学习--神经网络

    机器学习--神经网络机器学习--神经网络机器学习--神经网络机器学习--神经网络

    daacheng#pythonForMachineLearning#机器学习笔记一--基本概念1

    1. 决策树Decision Tree(ID3决策树归纳算法) 2. 临近取样Nearest Neighbor(KNN) 3. 支持向量机Support Vec

    机器学习-概念学习 PPT

    介绍了概念学习的基本方法,对归纳学习进行了阐述

    机器学习-计算学习理论精选-PPT

    在这份PPT中,我们首先介绍了机器学习的基本概念和分类,帮助观众建立起对机器学习领域的整体认识。接着,我们深入探讨了计算学习理论的核心内容,包括PAC学习模型、VC维、复杂度分析等重要概念,为观众揭示了机器...

    美国OpenAI公司开发的机器学习系统-Hide and Seek(捉迷藏)游戏源代码

    Hide and Seek(捉迷藏)游戏,熟悉机器学习系统的基本结构,包括定义、工作原理、设计方法以及影响系统设计重要因素,了解机器学习系统的开发与应用,更好地理解机器学习的概念以及机器学习基本方法,包括传统学习...

    清华大学-学堂在线-大数据机器学习课件笔记.zip

    清华大学-学堂在线 大数据机器学习课件笔记系列:概述、机器学习的基本概念、模型性能评估、感知机、聚类、贝叶斯分类器及图模型、决策树和随机森林、逻辑斯谛回归与最大熵模型、支持向量机 SVM、核函数与非线性 SVM...

    机器学习-VC维

    包含监督学习与非监督学习的基本概念,VC维,概率逼近学习的基本原理

    机器学习,深度学习部分基本概念

    有公式写不了博客,只能上传了,为什么没有0分资源。...机器学习,深度学习的一些基本概念,找工作整理得。 有公式写不了博客,只能上传了,为什么没有0分资源。 机器学习,深度学习的一些基本概念,找工作整理得。

    机器学习深度学习基本概念(小白版)

    想入门机器学习领域或深度学习领域的不可或缺之物

    机器学习_核函数基本概念.doc

    机器学习_核函数基本概念.doc

    量子机器学习算法综述

    首先,介绍了量子计算和机器学习的基本概念;其次,从四个方面分别介绍了量子机器学习,分别是量子无监督聚类算法、量子有监督分类算法、量子降维算法、量子深度学习;同时,对比分析量子机器学习算法与传统机器学习算法的...

    机器学习及其应用.pptx

    关于机器学习的意义,基本的概念,基本的认知与发展趋势,统计机器学习的基本方法, 典型机器学习开发包。

    机器学习的基本概念 机器学习适用的领域

    包括人工智能、概率统计、信息论、神经生物学等学科的发展为机器学习提供了丰富的素材

    机器学习的9个基础概念和10种基本算法总结.

    机器学习的9个基础概念和10种基本算法总结.

    机器学习实战 - 决策树PDF知识点总结 + 代码实现

    在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。 决策树是一种树...

    机器学习概论--入门精讲视频

    本课程是机器学习的普及课程,是基础的课程,主要介绍机器学习的定义、分类(回归学习与分类学习、监督学习与无监督学习)、基本术语(维数、学习、训练、学习器、样例、聚类、泛华、鲁棒、分布等);介绍什么是假设...

    认识机器学习培训

    机器学习的应用 机器学习定义 机器学习的几个基本概念 有监督学习、无监督学习、回归、分类 机器学习具体算法概述 有监督学习算法 无监督学习算法 总结和讨论

    算法工程师-机器学习面试题总结

    1-1 简述解决一个机器学习问题时,你的流程是怎样的? 1-2 损失函数是什么,如何定义合理的损失函数? 1-3 回归模型和分类模型常用损失函数有哪些?各有什么优缺点 1-4 什么是结构误差和经验误差?训练模型的...

Global site tag (gtag.js) - Google Analytics