wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz
tar -xzvf mahout-distribution-0.8.tar.gz
cd mahout-distribution-0.8
sudo vi /etc/profile
增加:
export PATH=$PATH:/home/ysc/mahout-distribution-0.8/bin
source /etc/profile
数据:hadoop fs -put clustering_material.txt testdata/clustering_material.txt
聚类1:mahoutorg.apache.mahout.clustering.syntheticcontrol.kmeans.Job
分析1:mahout clusterdump --input output/clusters-10-final --pointsDir output/clusteredPoints --output output/clusteranalyze_kmeans.txt
查看:
hadoopfs -lsr output
more output/clusteranalyze_kmeans.txt
VL-19代表这是一个cluster,n=161代表该cluster有161个点,c=[...]代表该cluster的中心向量点,r=[...]代表cluster的半径
聚类2:mahout org.apache.mahout.clustering.syntheticcontrol.canopy.Job
分析2:mahout clusterdump --input output/clusters-0-final --pointsDir output/clusteredPoints --output output/clusteranalyze_canopy.txt
聚类3:mahout org.apache.mahout.clustering.syntheticcontrol.fuzzykmeans.Job
分析3:mahout clusterdump --input output/clusters-6-final --pointsDir output/clusteredPoints --output output/clusteranalyze_fuzzykmeans.txt
聚类4:mahout org.apache.mahout.clustering.syntheticcontrol.dirichlet.Job
分析4:mahout clusterdump --input output/clusters-5-final --pointsDir output/clusteredPoints --output output/clusteranalyze_dirichlet.txt
聚类5:mahout org.apache.mahout.clustering.syntheticcontrol.meanshift.Job
分析5:mahout clusterdump --input output/clusters-3-final --pointsDir output/clusteredPoints --output output/clusteranalyze_meanshift.txt
相关推荐
mahout0.11版本,源码,可修改源码并自己编译,使用java语言编写,maven编译
使用mahout机器学习改进solr查询结果
IT十八掌第三期大数据配套学习笔记! 1.Spark简介 2.Spark部署和运行 3.Spark程序开发 4. Spark编程模型 5.作业执行解析 6.Spark SQL与DataFrame 7.深入Spark Streaming 8.Spark MLlib与机器学习 9.GraphX与SparkR 10...
mahout mahout机器智能推荐系统
包括Mahout in Action(英文版)和Mining of Massive Datasets (英文版)
Mahout机器学习领域分布式计算框架,详细介绍PPT
讲述了如何利用mahout机器学习改进solr查询结果
大数据Mahout实践指南+零起点Python大数据与量化交易高清书签
该数据包含两列,数据之间用空格进行划分,主要用来进行聚类分析,可以直接作为mahout机器学习平台的实验数据
Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者 Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容。
If you are a Java developer and want to use Mahout and Machine Learning to solve Big Data ...Chapter 9: Case Study – Churn Analytics and Customer Segmentation Chapter 10: Case Study – Text Analytics
mahout-learning mahout算法学习代码
教你成功运行mahout的taste webapp例子,网上的很多资料说的不清楚,或者版本冲突。正确的版本是jdk1.6 maven3.0.5 mahout0.5 。 摸索良久,亲测有效!
大数据技术丛书-Mahout实践指南.pdf
机器学习 推荐引擎 聚类 分类 算法 数据挖掘
Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid 分布式协调服务:Zookeeper 集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager 数据挖掘、机器学习:Mahout、Spark MLLib ...
Mahout 演示欢迎来到驯象师演示。 开发这个项目是为了展示 mahout 是如何工作的。 默认情况下,它使用 GroupLens 用户、电影和偏好数据( )。 只要每个文件都遵循 CSV 格式,就可以加载任何其他用户、项目和首选项...
驯象师 mahout-推荐-测试 这是对 Mahout 推荐人的测试。 包含测试相似性和评估。 文档: : API: :