Describe用于生成数据描述文件主要用于决策树分类使用,换句话说就是对数据项的描述说明,为json格式,生成的样例如下:
[ { "values": null, "label": false, "type": "numerical" }, { "values": [ "icmp", "udp", "tcp" ], "label": false, "type": "categorical" } ]
主要包括三项,类型,是否为label和值,如果是数值型的那么不会罗列其数值会以null的形式存在,描述项支持的类型如下:
I 忽略不参与计算 N 数值型 C 字符串型 L 类标签
使用方式:
hadoop jar your.jar org.apache.mahout.driver.MahoutDriver org.apache.mahout.classifier.df.tools.Describe -p /user/test/input/KDDTrain+.TXT -f /user/test/input/data.info -d N 3 C 2 N C 4 N C 8 N 2 C 19 N L N
相关推荐
NULL 博文链接:https://snv.iteye.com/blog/2007843
mahout-examples-0.11.1 mahout-examples-0.11.1-job mahout-h2o_2.10-0.11.1 mahout-h2o_2.10-0.11.1-dependency-reduced mahout-hdfs-0.11.1 mahout-integration-0.11.1 mahout-math-0.11.1 mahout-math-0.11.1 ...
mahout-0.3.tar
NULL 博文链接:https://irwenqiang.iteye.com/blog/1561733
基于java讲解了mahout的主要的三种算法,聚类,分类,相似度,非常适合初学者的学习
mahout_help,mahout的java api帮助文档,可以帮你更轻松掌握mahout
Mahout 官方文档,简单介绍Mahout概念及其安装和简单使用
maven_mahout_template-mahout-0.8
使用mahout机器学习改进solr查询结果
使用Mahout,你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。, 本书出自Mahout核心成员之手,得到Apache官方推荐,权威性毋庸置疑。作者凭借多年实战经验,为读者展现了丰富的...
MAHOUT实战 MAHOUT IN ACTION
自己制作的mahout的API,方便使用时的查询。全英文的。
mahoutAlgorithms源码分析 mahout代码解析
Mahout支持K-Means等聚类算法,在此zip包中已经有打好jar包的资源,不需要用户再打jar包,可以直接使用。
Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。 机器学习 • 机器学习是人工智能的一个分支,...
mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7
If you are a Java developer and want to use Mahout and Machine Learning to solve Big Data analytics use-cases then this book is for you. Familiarity with shell-scripts is assumed but no prior ...
9.Hadoop入门进阶课程_第9周_Mahout介绍、安装与应用案例.pdf
mahout-core-0.9.jar+mahout-core-0.8.jar+mahout-core-0.1.jar
hibernate + struts + spring + bootstarp + mahout 实现功能: 后台图书管理: 图书的增删改查, 后台类目。 前台书店: 图书的分页查看, 前台类目, 多条件查询, 智能推荐, 购物车, 支付。