一、安装配置
1、安装、配置JDK,Hadoop(略)
2、下载Mahout,http://mahout.apache.org/ ,非源码下载解压即可用(src为源码包,需要用maven编译)。
3、添加环境变量修改/etc/profile 或者 ~/.bashrc ,添加export JAVA_HOME=/opt/java/jdk1.7.0_05
export JAVA_HOME=/home/alan/hadoop/hadoop-1.0.3
export HADOOP_CONF_DIR=/home/alan/hadoop/hadoop-1.0.3
export MAHOUT_HOME=/home/alan/mahout/mahout-distribution-0.7
#export HADOOP_HOME_WARN_SUPPRESS=1
通过$MAHOUT_HOME/bin/mahout 命令检测是否安装成功。
二、运行示例
1、启动 Hadoop (hadoop namenode -format;start-all.sh)
2、下载测试输入数据
3、把数据导入HDFS中
4、运行示例如:Kmeans聚类算法
$bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.6-job.jar org.apache.mahout.clustering.
syntheticcontrol.kmeans.Job
他会启动多个job,输出output/大致如:
clusteredPoints/ clusters-2/ clusters-6/ data/ clusters-0/ clusters-3/ clusters-7/ clusters-1/ clusters-4/ clusters-8/ clusters-10-final/ clusters-5/ clusters-9/
分享到:
相关推荐
mahout测试数据 mahout测试数据 mahout测试数据 mahout测试数据 mahout测试数据 mahout测试数据
数据挖掘工具mahout环境搭建 数据挖掘 hadoop
mahout KMeansDriver测试相关jar包,有需要的同学可以下载来试试。把这个包放入hadoop/lib下面然后就可以在eclipse里面运行调试了。
mahout0.9测试详细傻瓜说明,简单测试外加kmeans算法,绝对详细
mahout的详细安装,包括编译安装和快速安装,能够在hadoop上测试算法。
mahout测试数据 raw文件夹下有5目录(camera computer household mobile MP3)每个目录下有1000多篇文章
mahout canopy+kmeans测试数据
https://github.com/chubbyjiang/MapReduce
Mahout是一个Java的机器学习库。Mahout的完整源代码,基于maven,可以轻易导入工程中
使用mahout搭建大数据平台,更方面大数据研发人员研发力度。
最新的HADOOP2.4.1版本不支持MAHOUT 0.9,本MAHOUT 0.9是经过修改官方MAHOUT 0.9源代码后的源码包,可直接导入ECLIPS中编译、安装,也可通过命令行进行。
mahout_help,mahout的java api帮助文档,可以帮你更轻松掌握mahout
maven_mahout_template-mahout-0.8
MAHOUT实战 MAHOUT IN ACTION
mahoutAlgorithms源码分析 mahout代码解析
mahout-examples-0.11.1 mahout-examples-0.11.1-job mahout-h2o_2.10-0.11.1 mahout-h2o_2.10-0.11.1-dependency-reduced mahout-hdfs-0.11.1 mahout-integration-0.11.1 mahout-math-0.11.1 mahout-math-0.11.1 ...
Hadoop 2.6.0+Hbase1.12+mahout0.9 集群搭建,自己写的,可以根据实际情况搭建伪分布式或者完全分布式。
mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7
Mahout 官方文档,简单介绍Mahout概念及其安装和简单使用
mahout0.9配置说明,比较短,新手向,后面还有测试说明,在我的资源里找