x = (x1,...,xn) 和y = (y1,...,yn) 之间的距离为
(1)欧氏距离 EuclideanDistanceMeasure
(2)曼哈顿距离 ManhattanDistanceMeasure
(3)马氏距离MahalanobisDistanceMeasure
马氏距离是由印度统计学家马哈拉诺比斯提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似 度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的 (scale-invariant),即独立于测量尺度。 对于一个均值为,协方差矩阵为的多变量向量,其马氏距离为
马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为的随机变量与的差异程度:
如果协方差矩阵为单位矩阵,马氏距离就简化为欧氏距离;如果协方差矩阵为对角阵,其也可称为正规化的欧氏距离。
其中是的标准差。
(4)余弦距离 CosineDistanceMeasure
(5)汉明距离
在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。 例如:
1011101 与1001001 之间的汉明距离是 2。
2143896 与2233796 之间的汉明距离是 3。
"toned" 与 "roses" 之间的汉明距离是 3。
(6)平方欧几里德距离度量 SquaredEuclideanDistanceMeasure
(7)Tanimoto距离 TanimotoDistanceMeasure
(8)加权距离度量 WeightedDistanceMeasure ,具体实现有:WeightedEuclideanDistanceMeasure和WeightedManhattanDistanceMeasure
用欧几里德距离和曼哈顿距离实现。加权距离度量是Mahout的高级特征,它能让你在不同维上赋予不同的权重,以此对距离度量信息产生影 响,WeightedDistanceMeasure在向量格式化中需要序列化为文件。变量对距离的影响是不一样的,通过权值来确定。
(9)切比雪夫距离 ChebyshevDistanceMeasure
若二点p及q的直角坐标系坐标为 及,则切比雪夫距离为
相关推荐
官方下载的mahout-distribution-0.9.tar.gz 因为下载速度实在太慢,所以分享出来,方便大家下载使用。mahout-distribution-0.9.tar.gz
mahout-core-0.9.jar+mahout-core-0.8.jar+mahout-core-0.1.jar
mahout-0.9-cdh5.5.0.tar.gz
mahout0.11版本,源码,可修改源码并自己编译,使用java语言编写,maven编译
mahout-distribution-0.9-src.zip
mahout-core-0.9.jar,支持版本hadoop-2.2.x,由mahout-distribution-0.9.tar.gz源码构建生成jar包。
maven_mahout_template-mahout-0.8
mahout是用来做大数据推荐系统和机器学习使用的框架,这个工具包官网下载非常慢,下载了一夜终于下载到了,刚好够上传的
mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7mahout-integration-0.7
mahout-distribution-0.5-src.zip mahout 源码包
mahout-examples-0.10.1-job.jar 已经包含分词程序,替换掉mahout默认的jar包
mahout实战 源码 mahout实战 配套 mahout-distribution-0.5.tar.gz 版本
官方mahout-distribution-0.12.2-src.tar.gz
mahout-distribution-0.10.0-src.tar.gz
mahout中需要用到的一个版本jar包:mahout-core-0.3.jar
重新编译mahout-examples-0.9-job.jar,增加分类指标:最小最大精度、召回率。详情见http://blog.csdn.net/u012948976/article/details/50203249
apache-mahout-distribution-0.12.1.tar.gz 开源版本 .
mahout-distribution-0.9所含必备jar包,只有jar包,不含源代码。
mahout-math-0.8.jar mahout-math-0.8.jar
教你成功运行mahout的taste webapp例子,网上的很多资料说的不清楚,或者版本冲突。正确的版本是jdk1.6 maven3.0.5 mahout0.5 。 摸索良久,亲测有效!