最新文章列表

Weka入门实例之KMean聚类实现

/*上次我介绍了分类器的使用方法,这次我来介绍一下聚类算法。聚类算法在数据挖掘里面被称之为无监督学习(unsupervised learning),这是与分类算法(supervised learning)相对的。在它们两者之间还一种叫做半监督学习(semi-supervised learning)这个我会在后面的文章中重点介绍。所谓无监督学习就是在预先不知道样本类别的情况下,由聚类算法来判别样本 ...
ganliang13 评论(0) 有6243人浏览 2013-10-21 20:15

mahout之Kmeans使用及结果分析

Mahout-Kmeans 1,两个输入路径:一个是数据的点;一个是初始集群。      点的输入文件是SequenceFile(Key, VectorWritable)格式;       而初始集群的输入文件格式是SequenceFiles(Text, Cluster | Canopy) 2,每次迭代会产生一个输出目录“cluster-N”,输出文件格式为SequenceFile(Te ...
ghost_face 评论(0) 有4445人浏览 2013-07-12 19:32

java实现kmeans算法

kmeans算法是一种经典的聚类算法,其核心思想是:根据给定的聚类个数k,随机选择k个点作为初始的中心节点,然后按照样本中其他节点与这k个节点的距离进行分类。每分类一次就重新计算一次k个中心节点,直到所有样本中的节点所属的分类不再变化为止。 代码: public class KmeansAlgorithm { private static final int T = 10; // 最大迭 ...
czhsuccess 评论(0) 有3924人浏览 2013-07-04 15:08

聚类算法之kmeans算法java版本

   聚类的意思很明确,物以类聚,把类似的事物放在一起。     聚类算法是web智能中很重要的一步,可运用在社交,新闻,电商等各种应用中,我打算专门开个分类讲解聚类各种算法的java版实现。     首先介绍kmeans算法。     kmeans算法的速度很快,性能良好,几乎是应用最广泛的,它需要先指定聚类的个数k,然后根据k值来自动分出k个类别集合。     举个例子,某某教练在得到全队的数据 ...
AngelAndAngel 评论(6) 有20803人浏览 2012-04-22 21:34

K-MEANS聚类算法

K-MEANS 算法     输入聚类个数 k ,以及包含 n 个数据对象的数据库,输出满足方差最小标准的 k 个聚类。     k-means 算法接受输入量 k ;然后将 n 个数据对象划分为 k 个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得 ...
chuanwang66 评论(0) 有1546人浏览 2011-10-06 22:20

最近博客热门TAG

Java(141744) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54919) .net(54785) Web(54514) 工作(54118) Linux(50905) Oracle(49875) 应用服务器(43289) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37267) 数据结构(36424)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics