`

如何更好地学习机器学习?

 
阅读更多

Metacademy的创始人Colorado Reed发布过一篇名为“机器学习练级攻略”,文中回答了初学者经常问他的一个问题:如何才能更好地学习机器学习?这篇文章将总结Colorado的建议并分步讲解他文中的路线图。

 

如何更好地掌握机器学习

 

Colorado是伯克利大学的在读博士,同时也是Metacademy的创始人。Metacademy是一个优秀的开源平台,许多专业人员共同在这个平台上编写wiki文章。目前,这些文章主要围绕着机器学习和人工智能这两个主题。

在Colorado的建议中,更好地学习机器学习的方法就是不断的通过书本学习。他认为读书的目的就是让心中有书。

 

一个博士在读生给出这样的建议并不令人惊讶,以前本站可能还推荐过类似的建议。这个建议还可以,但我不认为适用每个人。如果你是个开发者,想实现机器学习的算法。下面列出的书籍是一个很好的参考,可以从中逐步学习。

 

机器学习路线图

 

他的关于机器学习的路线图分为5个级别,每个级别都对应一本书必须要掌握的书。这5个级别如下:

 

  • Level 0(新手):阅读《Data Smart: Using Data Science to Transform Information into Insight》。需要了解电子表格、和一些算法的高级数据流。
  • Level 1(学徒):阅读《Machine Learning with R》。学习在不同的情况下用R语言应用不同的机器学习算法。需要一点点基本的编程、线性代数、微积分和概率论知识。
  • Level 2(熟练工):阅读《Pattern Recognition and Machine Learning》。从数学角度理解机器学习算法的工作原理。理解并调试机器学习方法的输出结果,同时对机器学习的概念有更深的了解。需要有算法、较好的线性代数、一些向量积分、一些算法实现经验。
  • Level 3(大师):阅读《Probabilistic Graphical Models: Principles and Techniques》。深入了解一些高级主题,如凸优化、组合优化、概率论、微分几何,及其他数学知识。深入了解概率图模型,了解何时应该使用以及如何解释其输出结果。
  • Leval 4(宗师):随便去学吧,记得反馈社区。

Colorado针对每个级别中列出的书中章节阅读建议,并给出了建议去了解的相关顶级项目。

 

Colorado后来重新发布了一篇博客,其中对这个路线图做了一点修改。他移除了最后一个级别,并如下定义了新的级别:好奇者、新手、学徒、熟练工、大师。他说道,Level 0中的机器学习好奇者不应该阅读相关书籍,而是浏览观看与机器学习有关的顶级视频。

 

机器学习中被忽视的主题

 

Scott Locklin也阅读了Colorado的那篇博客,并从中受到了启发,写了一篇相应的文章,名为“机器学习中被忽视的想法”(文中有Boris Artzybasheff绘制的精美图片)。

 

Scott认为Colorado给出的建议并没有充分的介绍机器学习领域。他认为很少有书籍能做到这一点,不过他还是喜欢Peter Flach所著的《Machine Learning: The Art and Science of Algorithms that Make Sense of Data》这本书,因为书中也接触了一些隐晦的技术。

 

Scott列出了书本中过分忽视的内容。如下所示:

 

  • 实时学习:对流数据和大数据很重要,参见Vowpal Wabbit
  • 强化学习:在机器人方面有过讨论,但很少在机器学习方面讨论。
  • “压缩”序列预测技术:压缩数据发现学习模式。参见CompLearn
  • 面向时间序列的技术。
  • 一致性预测:为实时学习精确估计模型。
  • 噪声背景下的机器学习:如NLP和CV。
  • 特征工程:机器学习成功的关键。
  • 无监督和半监督学习。

这个列表很好的指出了机器学习中没有注意到的领域。

 

最后要说明的是,我自己也有一份关于机器学习的路线图。与Colorado一样,我的路线图仅限于分类/回归类型的监督机器学习,但还在完善中,需要进一步的调查和添加所有感兴趣的主题。与前面的“读这些书就可以了”不同,这个路线图将会给出详细的步骤。

 

英文出处:Jason Brownlee

分享到:
评论

相关推荐

    机器学习基石电子版笔记

    先简单介绍下这门课程,这门课是在著名...在何时可以使用机器学习? Why can Machine Learn? 为什么机器可以学习? How can Machine Learn?机器可以怎样学习? How can Machine Learn Better?怎样能使机器学习更好?

    《机器学习》简明导论.pdf

    计算机能过滤掉60%以上的电干邮件,并随着时间的推移,通过不断的自我学习来更好地保护你你能让计算机精确地识别图片中的人物吗?通过对所有的可能性进行编码去识别一个人也许是可行的.但却是不切实际的,你很快会发现...

    Python机器学习手册.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

    基于机器学习的入侵检测技术研究

    质是一个分类问题,而机器学习能较好地完成各种分类任务。本文首先通过将机 器学习应用到入侵检测技术中,评估了各类机器学习算法在入侵检测中的效果; 在此基础上,通过研究各种机器学习算法在入侵检测中所展现的...

    人工智能机器学习图像识别

    积分下载你是否会使用Siri或Alexa等个人助理系统?你是否用垃圾邮件过滤器来处理垃圾邮件?你是否订阅Netflix,并...为了更好地理解它,让我们在文本中解读这几个概念:机器学习是什么、发展历程、内部原理和重要性。

    斯坦福大学机器学习学习课程讲义.rar_斯坦福大学机器学习_机器学习

    斯坦福大学机器学习课程讲义,有助于更好理解课程内容

    机器学习算法汇总.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

    李宏毅机器学习HW5.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

    机器学习和深度学习个人笔记合集

    在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识。机器学习是当今非常普遍,你可能会使用这一天几十倍而不自知。很多研究者也认为这是最好的人工...

    Scala机器学习Scala机器学习.zip

    简而言之,机器学习使计算机具备从经验中学习的能力,以便更好地处理复杂的问题和任务。 传统的编程方法主要是通过编写明确的规则和指令来解决特定问题,而机器学习则是通过对大量数据进行分析和学习,让计算机自己...

    学习机器学习.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

    Python数据挖掘与机器学习开发实战的常见试题与参考答案.pdf

    机器学习是一门理论性和实践性都比较强的技术学科。为了帮助大家对这些知识点进行梳理和理解,以便能够更好地应对招聘单位所出的机器学习方面的面试题,笔者准备了些这方面的试题,希望能够对大家有所帮助。

    基于机器学习的量化选股研究

    投资者都希望能挑选出相对于其他股票在未来表现更好的股票,基于此,本文尝 试将机器学习领域中两种较为成熟的学习排序算法GBDT和GBRank应用到选股 问题中。本文以技术分析为理论根据,先后构建了基于模式识别的短线...

    机器学习和深度学习核心知识点总结

    一年一度的校园招聘就要开始了,为了帮助同学们更好的准备面试,SIGAI 在今天的公众号文章中对机器学习、深度学习的核心知识点进行了总结。希望我们的文章能够帮助你顺利的通过技术面试,如果你对这些问题有什么疑问...

    机器学习术语表

    包含机器学习相关的术语解释表。 A/B 测试 (A/B testing) 一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B 测试不仅旨在确定哪种技术的效果更好,而且还有助于了解相应...

    机器学习基础.pptx

    机器学习是学好人工智能的基础,基础知识的学习方便大家更好的去了解机器学习的内容和学习的方向,初学者了解机器学习最好的文件!

    机器学习入门好文,强烈推荐.zip

    ### 内容概要 本博客为初学者提供了一个...博客中包含的建议和资源可以帮助读者更好地理解和应用所学知识。同时,博客还强调了学习机器学习需要持续的努力和实践,鼓励读者积极参与社区和比赛,提高机器学习的技能。

    机器学习学习.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

    机器学习清单

    机器学习的发展可以追溯到1959年,有着丰富的历史,为了更好的学习机器学习,在这里汇总了一些有关机器去学习和NLP的网络资源。

    记录学习机器学习算法.zip

    随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...

Global site tag (gtag.js) - Google Analytics