分类技术决定一个东西是不是某个类型或种类的一部分,或者有没有某些属性。分类同样是普遍存在的,虽然这是更多的幕后工作。这种系统问题通常是通过对目录中的项目,很多例子的回顾来了解,从而推断出分类的规则。这里大致可以发现很多应用程序:
雅虎邮件,决定收到的消息是否是垃圾邮件,这基于用户之前的电子邮件和垃圾邮件报告,和电子邮件本身的特性一样。一些被分类为垃圾邮件的信息将会在图1.4中显示。
Picasa(http://picasa.google.com/)和其他一些相片管理应用程序,可以从一个图像中识别出一个人的脸部。
光学字符辨识软件,通过把小范围的已扫描的文本分割成若干个小单元格的个体,来分成单字。
Apple在报道的iTunes中的天才特性,就是用分类技术为用户把歌曲分成潜在的播放列表。
图1.3 雅虎邮件发现的垃圾邮件信息
基于用户的垃圾邮件报告,加上其他的分析,系统已经获得了通常用来辨认垃圾邮件的某些属性。例如,在“viagra”提到的信息经常是垃圾邮件,通常的拼错的如“v1agra”中也是这样。这样例子的存在是一个例子的一个属性,这个属性是从一个垃圾邮件分类器可以获得的。
- 大小: 9.3 KB
分享到:
相关推荐
网上流传的Mahout In Action一般为前13章,本文为完整版,比较难得
该资源是mahout in action 中的源码,适用于自学,可在github下载:https://github.com/tdunning/MiA
mahout in action英文正版电子书,书中附带多个基于mahout的推荐系统源码,是一本学习推荐系统,上手推荐系统的圣经!
1.4 Setting up Mahout 6 Java and IDEs 7 ■ Installing Maven 8 ■ Installing Mahout 8 ■ Installing Hadoop 9 1.5 Summary 9 PART 1 RECOMMENDATIONS...........................................11 2 ...
一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。 Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。
Mahout in Action 3. Representing data 4. Making recommendations 5. Taking recommenders to production 6. Distributing recommendation computations Part 2 Clustering 7. Introduction to clustering 8. ...
Mahout In Action 2012.pdf 配套源代码 Mahout In Action 2012 Source Code 原书 Mahout In Action 2012 版本 源代码。 帮助理解推荐系统的常用算法,分布式信息挖掘技术。
Mahout In Action 清晰完整版 聚类分析、算法推荐
mahout in action中的example codes进行maven编译时由于maven相关jar包的URL的重定位,故无法进行有效编译,需要下载相关jar包进行手动加载!
Mahout in action 实战中文版 高清 完整,,最经典的hadoop机器学习库
Mahout in Action 2012年新版
很不容易找到的Mahout in Action 完整版,而且是2012版的
Mahout in action 中文版,简介,快速入门
mahout in action 目前最全的版本
mahout is a library for data mining / machine learning using Hadoop technologies.
mahout in action 第一章 第二章 第三章第四章 第六章第七章 第九章
完整版的Mahout in Action 2,包含了分类,推荐,聚类三部分所有内容,PDF清晰版