参考:
http://dongxicheng.org/data-mining/naive-bayes-in-hadoop/
您还没有登录,请您登录后再发表评论
HADOOP分类算法还有Hadoop聚类算法,可以继续搜索
一种数据挖掘算法在Hadoop集群上的研究与实现.pdf
实验题目:基于Hadoop的并行贝叶斯分类算法的设计与实现 实验论文 包括实现方案和截图
基于Hadoop的K近邻分类算法的研究 Hadoop K近邻 分类 算法 MapReduce
hadoop大数据针对apriori算法的设计于实现
摘要:为了提高k-nearestneighboralgorithm(KNN)算法处理大数据集的能力,本文利用MapReduce并行编程模型,同时结合KNN算法自
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征...
Slope One算法在Hadoop平台的改进实现,鲍崴崴,苏放,近年来电子商务网站对精确投放广告的需求日益加大,协同过滤的推荐算法作为一种力求准确推测用户需求的方案,应用越来越普遍。本
针对这些问题,这里对传统的朴素贝叶斯算法进行了分析和改进,提出了SVM_WNB分类算法,并且在Hadoop云平台上对算法实现并行化处理,使其能够对大数据进行处理。实验验证,改进后的算法在准确性和效率等方面有明显...
hadoop实现聚类算法 利用MapReduce框架和HDFS来实现快速聚类
该项目实现了KNN算法在Hadoop平台基于欧拉距离,加权欧拉距离,高斯函数的MapReduce实现。 特色或创意:实例上添加了基于欧拉距离,加权欧拉距离,高斯函数的实现。 使用的是著名的鸢尾花数据集。据集内包含 3 类...
基于Hadoop的Kmeans算法实现:Kmeans算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标。即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的...
数据算法-Hadoop Spark大数据处理技巧 1.
为提高Hadoop平台性能,提出一种基于粒子群优化算法的Hadoop调度算法。以粒子位置代表可行的资源调度方案,以任务完成时间及资源负载均衡度作为目标函数,通过粒子群优化算法,找到最优的资源调度方案。实验结果表明,该...
用MapReduce实现TF-IDF,Hadoop版本是2.7.7,参考某教程亲自手写的,可以运行,有问题可以留言
数据算法:Hadoop/Spark大数据处理技巧
分析了KNN分类算法的流程,然后在K值的动态获取和...利用MapReduce编程思想完成KNN分类算法在Hadoop集群环境下的移植和实现。实验数据证明,改进后的KNN分类算法在人脸识别精度、识别效率和稳定性3个方面得到了有效提高。
Hadoop mapreduce 实现KMeans,可用
数据算法: Hadoop+Spark大数据处理技巧,pdf,高清,带书签,下载下来解压即可
相关推荐
HADOOP分类算法还有Hadoop聚类算法,可以继续搜索
一种数据挖掘算法在Hadoop集群上的研究与实现.pdf
实验题目:基于Hadoop的并行贝叶斯分类算法的设计与实现 实验论文 包括实现方案和截图
基于Hadoop的K近邻分类算法的研究 Hadoop K近邻 分类 算法 MapReduce
hadoop大数据针对apriori算法的设计于实现
摘要:为了提高k-nearestneighboralgorithm(KNN)算法处理大数据集的能力,本文利用MapReduce并行编程模型,同时结合KNN算法自
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征...
Slope One算法在Hadoop平台的改进实现,鲍崴崴,苏放,近年来电子商务网站对精确投放广告的需求日益加大,协同过滤的推荐算法作为一种力求准确推测用户需求的方案,应用越来越普遍。本
针对这些问题,这里对传统的朴素贝叶斯算法进行了分析和改进,提出了SVM_WNB分类算法,并且在Hadoop云平台上对算法实现并行化处理,使其能够对大数据进行处理。实验验证,改进后的算法在准确性和效率等方面有明显...
hadoop实现聚类算法 利用MapReduce框架和HDFS来实现快速聚类
该项目实现了KNN算法在Hadoop平台基于欧拉距离,加权欧拉距离,高斯函数的MapReduce实现。 特色或创意:实例上添加了基于欧拉距离,加权欧拉距离,高斯函数的实现。 使用的是著名的鸢尾花数据集。据集内包含 3 类...
基于Hadoop的Kmeans算法实现:Kmeans算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标。即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的...
数据算法-Hadoop Spark大数据处理技巧 1.
为提高Hadoop平台性能,提出一种基于粒子群优化算法的Hadoop调度算法。以粒子位置代表可行的资源调度方案,以任务完成时间及资源负载均衡度作为目标函数,通过粒子群优化算法,找到最优的资源调度方案。实验结果表明,该...
用MapReduce实现TF-IDF,Hadoop版本是2.7.7,参考某教程亲自手写的,可以运行,有问题可以留言
数据算法:Hadoop/Spark大数据处理技巧
分析了KNN分类算法的流程,然后在K值的动态获取和...利用MapReduce编程思想完成KNN分类算法在Hadoop集群环境下的移植和实现。实验数据证明,改进后的KNN分类算法在人脸识别精度、识别效率和稳定性3个方面得到了有效提高。
Hadoop mapreduce 实现KMeans,可用
数据算法: Hadoop+Spark大数据处理技巧,pdf,高清,带书签,下载下来解压即可