阅读全文
http://click.aliyun.com/m/23305/
以下技术大多数已经发展了较长时间(在过去10年中),其中大部分缺点已经得到弥补,因此更新后的技术已经远不同于其原始版本,性能也大为提高。但通常情况下,这些有弊端的技术仍然被广泛使用。
1.线性回归
依靠一般标准、异方差性和其他假设,不能捕获高度非线性的混沌模式。它倾向于过度拟合、参数难以解读,并且在独立变量高度相关时非常不稳定。修正方法包括减少变量、进行变量变换,以及使用约束回归(例如,岭回归或Lasso回归)。
2.传统决策树
大而不稳定,无法解读,而且容易过度拟合。修正方法包括使用多个小决策树,而不是使用一个大决策树。
3.线性判别分析法
用于监督聚类。这是一个很差的技术,因为它假定簇没有重叠并且被超平面完全分开。在实践中从来没有这样的情况。应改用密度估计技术。
4.K-均值聚类
倾向于产生环形簇,不容易处理不符合高斯混合分布的数据点。
5.神经网络
不容易解读,不稳定,容易过度拟合。
6.最大似然估计
要求你的数据符合预先规定的概率分布。 它不是数据驱动的,很多时候预先指定的高斯分布和你的数据很不适合。
7.高维密度估计
常受到维度的影响。修正方法之一是使用非参数核密度估计与自适应的带宽。
8.朴素贝叶斯
用于如欺诈检测、垃圾邮件检测和评分。它们假定变量是独立的,但如果不是,就会惨遭失败。在进行欺诈检测和垃圾邮件检测时,变量(有时被称为规则)是高度相关的。修正方法之一是将变量分为独立的变量簇,每个簇包含高度相关的变量。然后将朴素贝叶斯应用于簇,或者使用数据减少技术。不好的文本挖掘技术(例如,垃圾邮件检测中的基本“单词”规则)和朴素贝叶斯结合会产生非常可怕的结果,带来很多误报和漏报。
这些不好的模型仍然被广泛使用的原因如下。
阅读全文
http://click.aliyun.com/m/23305/
分享到:
相关推荐
树高作为第三个预测变量,可提供最佳调整,并比采用其他两个预测变量(直径和木材比重)的模型少约8 t / ha,降低了生物量预测的不确定性。 调整标准足以评估模型的预测质量。 木材密度作为预测变量的指数需要更好...
LitleInfRAB_鲁棒波束_robustbeamforming_最差性能_源码.zip
本研究论文试图通过实验分析和预测建模来预测学生的表现,以便在未来提高。 教育资料库/数据库可以有足够的关于学习态度、能力的事实,并用于发现新的隐藏模式和知识。 这些隐藏的模式和知识稍后可以通过大学/学院...
可见光大气传输系统面临的主要问题在于由大气湍流引起的光强闪烁和来自日光及其他照明设备的强背景光干扰,为了克服大气湍流造成的信道衰落效应及强背景光...,对室外可见光通信(VLC)强背景光大气湍流信道进行了建模...
算法设计 horspool算法 最优 最差输入算法设计 horspool算法 最优 最差输入算法设计 horspool算法 最优 最差输入算法设计 horspool算法 最优 最差输入算法设计 horspool算法 最优 最差输入算法设计 horspool算法 ...
这种对学生学习过程的实验分析和预测建模可以作为更好的工具。 在这项研究中,人们认为教育资料库/数据库可以具有关于学习态度和能力等方面的充分事实。要发现新的隐藏模式和知识,必须理解这些因素。 这些隐藏的...
LitleInfRAB_鲁棒波束_robustbeamforming_最差性能.zip
Java编程最差实践,举了很多例子用来证明如何提高程序效率,如果做到编程规范,值得一看!
五一建模资源文通过多轮指标筛选,利用熵权法,虚拟控制点调节法,量化指标稳定性 对权重进行修正等方法建立对城市宜居性的综合评价模型,并对八个城市进行宜 居性排名,最后针对徐州的宜居性给出了建设性意见。 ...
最优适应法、最差适应法 操作系统课程设计 c++ 实现
非最终灭菌水针需要进行无菌模拟灌装工艺验证,验证过程应遵循最差条件选择原则。根据实际生产过程中出现可能的异常情况来选择最差条件。提出影响无菌灌装的主要因素有生产环境、生产人员、安瓶规格、生产所用灌装工...
最佳适应算法; 首次适应算法; 最坏适应算法三种算法的图形实现 VS2005 C++实现
华为集体面试 集体面试 集体面试经验集锦 经验集锦 经验集锦((((一一一一)))) ...”“你觉得他最差是吗?”“XXX 把你排在最后你同意吗?”“被排在最后的 是要被淘汰的,你仍然会把自己排在最后吗?”
省公司技术服务最差小区指标优化江门驻点支持项目总结会.ppt
循环首次适应算法 最佳适应算法 最坏适应算法
动态分区管理的主存分配模拟设计--最优适应法、最差适应法
16点忠告告诫所有电脑技术员 给经常修理电脑的朋友16点忠告 呵呵.朋友分享的,觉得不错,感觉说的基本都是大实话!!呵呵,大家认为呢? 1、首先记住这句话:永远不要承认自己是高手,因为这个称号是要付出代价的。 2...
得分与卷照分析 学生分数最高的是第三大,分数最差的 是第四大 数据可视化呈现与解读-信息技术全文共8页,当前为第5页。.目是 : 用自己的 如何制作子 ? 数据可视化呈现与解读-信息技术全文共8页,当前为第5页。 ...
决策树及神经网络算法在股票分类预测中的应用.pdf 本文选取 2012 年 A 股市场上 200 个上市公司为样本,其中 50 个为 A 股市 场上综合绩效最优的股票,50 个为综合绩效最差的股票,另外 100 个为随机选 取的综合绩效...