`
poson
  • 浏览: 349334 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

超大矩阵乘法的并行计算?hadoop map-reduce矩阵乘法

阅读更多
hadoop ,行与行的乘法。
http://carbon.cudenver.edu/csprojects/CSC5809S01/Simd/parmult.html
一直很奇怪矩阵的乘法怎么在hadoop上面实现。看了上面的演示,才发现其实事情很简单。
矩阵M*N=A,受到习惯思维的影响,矩阵的一个元素Aij是M的一行与N的一列相乘。但是实际上可以转换为M的一列中的每一个数和N中每一行相乘,然后累加起来,就是最后的矩阵A。

PageRank算法可以整理为矩阵的乘法,最后也就化解为map-reduce的计算方法。


svd分解的并行算法:
《Parallel Algorithms for the Singular Value Decomposition 》
《A parallel algorithm for computing the singular value decomposition of a matrix》

分享到:
评论
9 楼 poson 2011-07-29  
就是一个hadoop的算法;
好像mahout里面有hadoop 矩阵运算的例子?没有看过
8 楼 poson 2011-07-29  
那个网页就是把矩阵运算行*列,转换为行与行求内积的一个算法;

好像最多就只做过100万*100万的稀疏矩阵的乘法;

20084896 写道
那个网址好像不能访问了
博主用hadoop做过实验吗? 支持多大规模的矩阵呢?

7 楼 Oh_Shit 2011-07-21  
楼主大哥,能否给个代码给我。 。
  我在做矩阵算法,无从下手啊/
6 楼 poson 2010-05-07  
我们做的矩阵估计是几十万乘几十万的矩阵,如果是稀疏矩阵应该可以更大一些。
5 楼 20084896 2010-05-06  
那个网址好像不能访问了
博主用hadoop做过实验吗? 支持多大规模的矩阵呢?
4 楼 poson 2010-04-20  
这个是否可以:http://www.kreny.com/pagerank_cn.htm
3 楼 ytulgr 2010-04-17  
那篇文章出处能否告知?谢谢!
2 楼 poson 2010-04-17  
我没有把PageRank算法整理为矩阵。我们的问题有点类似pagerank,基本上是使用近似的算法。
网上有篇文章介绍的特别的详细。
1 楼 ytulgr 2010-04-17  
我正在做超大矩阵乘法的并行计算,看到楼主的文章。楼主能否讲解一下关于PageRank算法整理为矩阵的乘法,最后也就化解为map-reduce的计算方法的过程。谢谢!

相关推荐

    elasticsearch-hadoop-5.6.7

    elasticsearch-hadoop是一个深度集成Hadoop和ElasticSearch的项目,也是ES官方来维护的一个子项目,通过实现Hadoop和ES之间的输入输出,可以在Hadoop里面对ES集群的数据进行读取和写入,充分发挥Map-Reduce并行处理...

    akka-mapreduce:基于Scala和Akka的map-reduce框架

    akka-mapreduce是一个基于Scala和Akka的库,可使用Scala中的Akka actor运行所有“ map”和“ reduce”任务并行运行的map-reduce作业。 在我们的框架中,最初使用Akka Stream读取数据,我们要做的是提供一个 ,可...

    论文研究-Hadoop平台中一种Reduce负载均衡贪心算法 .pdf

    Hadoop平台中一种Reduce负载均衡贪心算法,刘朵,曾锋,MapReduce是目前广泛应用的并行计算框架,是Hadoop平台的重要组成部分。主要包括Map函数和Reduce函数。Map函数输出key-value键值对作为Reduce的

    hadoop map reduce 案例

    3. mapping : 并行将每一行按照空格进行拆分,拆分得到的 `List(K2,V2)`,其中 `K2` 代表每一个单词,由于是做词频统计,所以 `V2` 的值为 1,代表出现 1 次; 4. shuffling:由于 `Mapping` 操作可能是在不同的机器...

    基于Map_Reduce的并行关联分析方法

    本文在研究BIRCH算法、规则...map/reduce相结合,实现了算法的并行化计算,在一定程度上提高了算法的运行效率。最后的 实验结果表明,采用该关联方法可以有效提高聚类效果,减少重复报警,缩短关联分析的执行 时间。

    MapReduce_新型的分布式并行计算编程模型_李成华.pdf

    用户在使用MapReduce模型进行大规模数据处理时,可以将主要精力放在如何编写Map和Reduce函数上,其它并行计算中的复杂问题诸如分布式文件系统、工作调度、容错、机器间通信等都交给MapReduce系统处理,在很大程度上降低...

    hadoop 1.2.1 api 最新chm 伪中文版

    通常,hadoop Map/Reduce框架和分布式文件系统是运行在一组相同的节点上的,也就是说,计算节点和存储节点通常在一起。这种配置允许框架在那些已经存好数据的节点上高效地调度任务,这可以使整个集群的网络带宽被...

    Spark基本原理与设计思想

    虽然Spark是一个通用的并行计算框架,但是Spark本质上也是一个基于map-reduce算法模型实现的分布式计算框架,Spark不仅拥有了Hadoop MapReduce的能力和优点,还解决了Hadoop MapReduce中的诸多性能缺陷。

    基于Hadoop大数据平台实现遗传算法并行化

    基于Hadoop大数据平台实现遗传算法并行化,借助于Hadoop中的MapReduce模型,将遗传算法划分为Map和Reduce两个阶段,在Map阶段并行化执行。真正意义上实现了遗传算法的并行化。

    hadoop并行化和非并行化的kmeans算法.zip

    包含两种平台上运行的kmeans算法:一种是在Hadoop系统上的并行化kmeans算法,支持读文件,执行聚类算法,输出质心文件,将每个数据的聚类信息输出到控制台上;另一种是串行的聚类算法,支持读文件数据,执行kmeans...

    基于Hadoop下MapReduce框架实现的的并行C4.5算法.zip

    * 程序利用Eclipse EE在Hadoop平台下,使用Map/Reduce编程框架,将传统的C4.5决策树算法并行化; * 该部分属于本科毕业设计中,并行随机森林算法的核心部分; * Hadoop的搭建主要参考给力星的博客( ...

    Hello-Hadoop-netbeans-OS-X:用于在没有任何 3rd 方 hadoop 插件的情况下使用 HDFS API 的 Java Maven 项目

    HDFS 的直接编程控制和运行 map reduce 作业 - 所有单元测试都从 IDE 运行,该项目内置了 hadoop 配置并在 git 控制下。 通过实现 Web REST API 客户端将文件上传到 HDFS。 异步文件上传(在撰写本文时仅实现 ...

    Fourinone分布式并行计算四合一框架

     Fourinone对于分布式大数据量并行计算的解决方案不同于复杂的hadoop,它不像hadoop的中间计算结果依赖于hdfs,它使用不同于map/reduce的全新设计模式解决问题。Fourinone有“包工头”,“农民工”,“手工仓库”的...

    基于Hadoop平台的通信数据分布式查询算法的设计与实现

    设计了适合通信社会网络数据特色的 Map/Reduce算法。通过MaP和Reduee函数实现了数据的并行查询和处理。在数据查询过程中,还将数据遍历过程放Reduce函数中,从而使广度优先搜索算法的层次遍历过程也能够并行运行。这...

    Hadoop平台中一种Reduce负载均衡贪心算法 (2016年)

    MapReduce是目前广泛应用的并行计算框架,是Hadoop平台的重要组成部分。主要包括Map和Reduce函数,Map函数输出key-value键值对作为Reduce的输入。由于输入的动态性,不同主机上的Reduce处理的输入量存在不均衡性。...

    Hadoop权威指南 第二版(中文版)

     map阶段和reduce阶段  横向扩展  合并函数  运行一个分布式的MapReduce作业  Hadoop的Streaming  Ruby版本  Python版本  Hadoop Pipes  编译运行 第3章 Hadoop分布式文件系统  HDFS的设计  HDFS的概念 ...

    Hadoop权威指南(中文版)2015上传.rar

    第1章 初识Hadoop 数据!数据! 数据存储与分析 与其他系统相比 关系型数据库管理系统 网格计算 志愿计算 1.3.4 Hadoop 发展简史 Apache Hadoop和Hadoop生态圈 第2章 关于MapReduce 一个气象数据集 数据的格式 使用...

    Hadoop实战(第2版)

     《Hadoop硬实战》包含: ·Hadoop和MapReduce的基本概念 ·85个实战和测试技术 ·真实的场景,实用的解决方案 ·如何整合MapReduce和R前言 致谢关于本书 第1 部分 背景和基本原理1 跳跃中的Hadoop1.1 什么...

    使用Hadoop中的MapReduce计算框架可以对数字文本分析及求和

    使用Hadoop中的MapReduce计算框架可以对数字文本分析及求和,当遇到大规模数据时,使用别的编程语言会使得计算过程变得复杂,但使用MapReduce并行计算框架只需编写map函数和reduce函数即可,简单方便.zip

Global site tag (gtag.js) - Google Analytics