刚看了这篇博客 http://coolshell.cn/articles/10192.html
看完后, 觉得很有体会, 关于结论部分, 也补充一下自己的感受
综上所述,下面是我觉得数据挖掘或机器学习最重要的东西:
1)数据的质量。分为数据的标准和数据的准确。数据中的杂音要尽量地排除掉。为了数据的质量,大量人肉的工作少不了。
jimmee注: 是的, 不管数据量多大, 数据的质量如何, 噪音如何, 最后能否得出标准化的数据, 对后期的分析至关重要, 如果没有准确的数据, 那么得出的结论可能是相反的. 后期再花费多大的力气, 算法优化都是扯淡.
2)数据的业务场景。我们不可能做所有场景下的来,所以,业务场景和产品形态很重要,我个人感觉业务场景越窄越好。
jimmee注: 不同的业务场景, 可能使用到的算法是完全不同的, 照搬一个通用的算法去处理所有的业务, 基本来说是个愚蠢的行为, 做数据, 对业务的了解是很有必要的.
3)数据的分析结果,要让人能看得懂,知道接下来要干什么,而不是为了数据而数据。
jimmee注: 数据挖掘不是简单的统计, 分析出的数据能用来做什么, 需要能够落地到实处, 而不是想的美好, 对业务却没有任何帮助.
相关推荐
非常牛逼的大数据分析算法,推荐系统,大数据原理知识介绍
20190507科创 _ 锂电材料:嘉元科技,数据怎么比巨头还牛逼?-优塾指数█.pdf
超牛逼的大数据平台hadoop部署文档-v2,cloudera manager和CDH离线安装详解
大数据产业图谱,中国所以的大数据产业公司,分类最全,最牛B,而且是最新的
摘要准确标记耕地及计算耕地面积能为国家决策部门提供重要支撑。通过计算机识别卫星遥感影像中的耕地面积能够加速耕地信息的提取,减少人力、财力消耗。在初赛中,我队基于
超级牛B数据恢复软件是一款简单易用并且功能强大的文件恢复软件,支持FAT/FAT32/NTFS/exFAT文件系统,可以轻松恢复被误删除或者误格式化以及误分区或者分区表损坏丢失的磁盘文件数据,支持DOC, DOCX, XLS, XLSX, PPT...
易语言E-牛B模块.ec
Anytime算法 为什么需要Anytime算法 由于大数据规模很大,计算资源和时间约束不足以对数据进行精确分析,这就需要根据结果质量要求调配资源或者根据资源自适应调整结果质量。如在线聚集算法。 大数据分析算法全文共...
案例分析:3000万大学生用户怎样运营才叫牛逼? .doc
大量静态页面模板+牛逼的动态特效页面,很多资源的整合,只是没有目录得自己去找想要的
牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题
项目负责人聂再清,清华大学国强教授、AIR首席研究员,主要研究领域是大数据与AI的前沿创新,以及在健康医疗领域的产业应用,更早之前则以阿里达摩院大牛、天猫精灵首席科学家为人熟知。 △聂再清 此次开源的...
牛B硬件信息修改大师 牛B硬件信息修改大师 牛B硬件信息修改大师
2018最新版牛B硬件信息修改大师,很好用,亲测哦,需要的拿走
什么样的地推才叫牛逼?他们给出了教科书般的示范 .doc
当然如果你数据量都很小,我想4种方法就代码量和复杂程度来说第1种基本方法就可以了,或当你的硬件非常牛逼了,那再差的方法也可以高效的完成也没有探讨的实际意义了,呵呵说远了,本文主要是在不考虑硬件或同等硬件...
牛B硬件信息修改大师黑狼破解版,一键修改系统网卡系统计算机名字,适合亚马逊刷单
C编译器源代码(超级牛b)C编译器源代码(超级牛b)C编译器源代码(超级牛b)C编译器源代码(超级牛b)C编译器源代码(超级牛b)
最强大、最牛逼的javascript视频!!!!!!!!!!
最牛B的 Linux Shell 命令,最牛B的 Linux Shell 命令,