`

决策树

 
阅读更多



 决策树(DTs),是一种无参数的监督学习方法,用来分类和回归,目标是建立一个模型,可以通过学习数据特征的简单决策规则来预测目标属性的值。

如下图所示,决策树的输入数据近似正弦曲线,规则为if-then-else的规则集。树越深,抉择规则越复杂。

决策树的优点:

(1)便于理解和解释。树是可视化的。

(2)值需要少量的数据准备工作。其它的方法需要数据正式化、需要创建虚拟值并且空值需要清理掉。但是,需要注意的是,这个模型不支持缺失的属性值。

(3)训练树的复杂度是log级别的

(4)能够同时处理数值和分类数据。其它的方法一般只能处理一种数据。

(5)可以支持多输出

(6)使用白盒模型。模型的训练结果很容易解释。如果是在黑盒模型中(比如人工神经网络中),结果可能比较难解释。

(7)可以使用统计测试来评估模型。

(8) 即使由真实模型产出的数据和假设违背,该模型仍可用。

缺点是:

(1)决策树可以会生成很复杂的树,即过拟合。使用剪枝的方法,即设定叶子节点的最小数量或者设置树的最大深度可以避免过拟合。

(2)决策树是不稳定的因为有些数据可能会产出一个完全不同的树。这个问题可以通过使用一个决策树集合缓解。

(3)决策树的学习过程是一个NP完全问题,所以训练决策树学习的算法都是基于贪心算法,比如在每个节点取最优解。这种算法不能返回一个全局最优的决策树。这个问题可以通过放回的随机参数来训练多个树来解决。

(4)有些概念决策树表达不出来,比如XOR,对等关系和组合关系

(5)如果某些分类权重过大则可能造成产出的树有偏差,需要提前平衡数据集来修正决策树。

 

  • 大小: 57.4 KB
分享到:
评论

相关推荐

    机器学习+决策树+python实现对率回归决策树

    对于正确率相同的节点,选取优先遍历的属性作为根节点,与基于信息增益进行划分选择的方法相比,可知两种方法绘制的决策树正确率均为100%,但对率回归方法容易忽略在同一正确率下划分较佳的节点,从而使决策树层数...

    决策树算法经典优秀论文(1).zip

    决策树算法经典优秀论文(1).zip 决策树算法经典优秀论文(1).zip 决策树算法经典优秀论文(1).zip 决策树算法经典优秀论文(1).zip 决策树算法经典优秀论文(1).zip 决策树算法经典优秀论文(1).zip 决策树算法经典优秀...

    python决策树代码

    决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画...

    西瓜书《机器学习》---第四章 决策树python代码实现

    4.3 编程实现基于信息熵进行划分选择的决策树算法,并为西瓜数据集3.0中的数据生成一颗决策树。 4.4 编程实现基于基尼指数进行划分选择的决策树算法,为西瓜数据集2.0生成预剪枝、后剪枝决策树,并与未剪枝决策树...

    决策树算法python代码实现

    决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画...

    决策树与随机森林

    决策树是一种基本的分类与回归方法,学习通常包含三个步骤:特征选择、决策树的生成和决策树的剪枝。 决策树由结点和有向边组成,结点包括内部结点和叶节点,内部结点表示一个特征或属性,叶节点表示一个类。 决策...

    机器学习--决策树(ID3)算法及案例.docx

    机器学习--决策树(ID3)算法及案例.docx机器学习--决策树(ID3)算法及案例.docx机器学习--决策树(ID3)算法及案例.docx机器学习--决策树(ID3)算法及案例.docx机器学习--决策树(ID3)算法及案例.docx机器学习--决策树(ID3...

    ID3决策树算法-iris数据集-matlab实现-决策树绘制

    此程序主要实现对数据的加载和处理,首先加载数据,本...然后对数据创建决策树,结果存储于结构体中,后计算算法的准确率。最后将结构体数据转换成元胞数据,转换成treeplot系统函数能识别的数据形式,并绘制决策树。

    面向对象程序设计课程设计:利用决策树判断西瓜质量(源代码)

    以下数据集是经过确认的西瓜属性,请根据这些信息,利用决策树方法判定另外一批西瓜的质量。 1.学习有关决策树的相关知识 2.构建每个属性的信息增益,并写入到文件Gain.txt中 3.绘制决策树,保存成文件, Decision_...

    人工智能-机器学习-决策树-决策树分类(ID3,C4.5,CART)

    决策树分类(ID3,C4.5,CART) 三种算法的区别如下: (1) ID3算法以信息增益为准则来进行选择划分属性,选择信息增益最大的; (2) C4.5算法先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率...

    基于模糊控制和决策树的预测算法matlab仿真+代码操作视频

    1.领域:matlab,模糊控制和决策树算法 2.内容:基于模糊控制和决策树的预测算法matlab仿真+代码操作视频 3.用处:用于模糊控制和决策树算法编程学习 4.指向人群:本硕博等教研学习使用 5.运行注意事项: 使用...

    决策树算法原理详解

    决策树 信息熵(Entropy) 什么是决策树 决策树的构建过程 决策树分割属性选择 决策树量化纯度 决策树量化纯度 信息增益率计算方式 决策树的停止条件 决策树算法效果评估 决策树生成算法 ID3算法 ID3...

    《机器学习》算法实例-决策树算法-预测鱼类和非鱼类实例

    《机器学习》算法实例-决策树算法-预测鱼类和非鱼类实例 根据不浮出水面是否可以生存、是否有脚蹼2 个特征,将动物分成两类: 鱼类和非鱼类。 收集数据: 可以使用任何方法 准备数据: 树构造算法(这里使用的是ID3算法...

    Python数据挖掘项目开发实战_用决策树预测NBA获胜球队_编程案例实例详解课程教程.pdf

    本章介绍另一种分类算法——决策树,用它预测NBA篮球赛的获胜球队。比起其他算法,决策树有很多优点,其中最主要的一个优点是决策过程是机器和人都能看懂的,我们使用机器学习到的模型就能完成预测任务。正如我们将...

    基于Matlab实现决策树C4.5算法(源码+数据+教程).rar

    1、资源内容:基于Matlab实现决策树C4.5算法(源码+数据+教程).rar 2、适用人群:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业或毕业设计,作为“参考资料”使用。 3、解压说明:本资源需要电脑...

    波士顿房价决策树python编码

    第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数据集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除...

    初始决策树与随机森林

    初始决策树与随机森林 初始决策树与随机森林 初始决策树与随机森林

    决策树分类实验(乳腺癌).zip_wpbc数据集_乳腺癌数据_决策树 cancer_决策树分类程序(使用乳腺癌数据集)_决策树数

    决策树分类程序,包含使用的数据集和运行结果

    机器学习09--决策树02

    ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。从根结点(root node)开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不不同取值建立...

    决策树和朴素贝叶斯算法简介

    本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向边组成的层次结构。...

Global site tag (gtag.js) - Google Analytics