Hadoop简介 - 畅行天下 - ITeye博客

`

welcome66

浏览: 397617 次
性别:
来自: 北京

最近访客更多访客>>

zpfpublic

hzm7512

Shuhui

abb_fly

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

coolcgp： 1 楼的，赞！
eclipse安装SVN插件的两种方法
sea0108： ...
eclipse安装SVN插件的两种方法
liuweihug： javascript 阻止事件继续执行--冒泡行为控制 - h ...
jQuery 绑定事件及移除绑定事件方法和元素事件列表
welcome66：只要修改java代码，就需要重新编译，发布，才能运行的啊hon ...
Spring MVC 3 深入总结(转)
honglei0412：您好请教一下，关于springmvc 在控制层controll ...
Spring MVC 3 深入总结(转)

Hadoop简介

博客分类：

hadoop

hadoop map reduce hdfs

阅读更多

Hadoop是Apache 下的一个项目，由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中，HDFS 和MapReduce 是两个最基础最重要的成员。

HDFS是Google GFS 的开源版本，一个高度容错的分布式文件系统，它能够提供高吞吐量的数据访问，适合存储海量（PB 级）的大文件（通常超过64M），其原理如下图所示：

采用Master/Slave 结构。NameNode 维护集群内的元数据，对外提供创建、打开、删除和重命名文件或目录的功能。DatanNode 存储数据，并提负责处理数据的读写请求。DataNode定期向NameNode 上报心跳，NameNode 通过响应心跳来控制DataNode。

InfoWord将MapReduce 评为2009 年十大新兴技术的冠军。MapReduce 是大规模数据（TB 级）计算的利器，Map 和Reduce 是它的主要思想，来源于函数式编程语言，它的原理如下图所示：Map负责将数据打散，Reduce负责对数据进行聚集，用户只需要实现map 和reduce 两个接口，即可完成TB级数据的计算，常见的应用包括：日志分析和数据挖掘等数据分析应用。另外，还可用于科学数据计算，如圆周率PI 的计算等。Hadoop MapReduce的实现也采用了Master/Slave 结构。Master 叫做JobTracker，而Slave 叫做TaskTracker。用户提交的计算叫做Job，每一个Job会被划分成若干个Tasks。JobTracker负责Job 和Tasks 的调度，而TaskTracker负责执行Tasks。

分享到：

Eclipse下svn的创建分支/合并/切换使用 | MapReduce中的Shuffle和Sort分析

2013-07-03 12:28
浏览 1024
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop简介Word版: hadoop简介，可以初步认识hadoop

大数据及Hadoop简介.docx: 1、Hadoop 简介 2、Hadoop 的发展历史 3、Hadoop 的特点三、Hadoop 核心 1、分布式文件系统——HDFS 2、分布式计算框架——MapReduce 3、集群资源管理器——YARN 四、Hadoop 常用组件五、Hadoop 在国内外的应用...

Hadoop简介及Apache Hadoop三种搭建方式: 带图带说明：Hadoop简介及Apache Hadoop三种搭建方式

云计算简介，Hadoop简介，云计算环境下信息安全问题: 云计算简介，Hadoop简介，云计算环境下信息安全问题

Chapter11_Hadoop简介.pdf: Chapter11_Hadoop简介.pdf

福建师范大学精品大数据导论课程系列 (5.1.1)--4.1.1 hadoop简介之一.pdf: 福建师范大学精品大数据导论课程系列 (5.1.1)--4.1.1 hadoop简介之一.pdf 福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.pdf 福建师范大学精品大数据导论课程系列 (5.3.1)--4.2 HDFS的简要介绍...

福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.pdf: 福建师范大学精品大数据导论课程系列 (5.1.1)--4.1.1 hadoop简介之一.pdf 福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.pdf 福建师范大学精品大数据导论课程系列 (5.3.1)--4.2 HDFS的简要介绍...

hadoop简介: hadoop简介 ,ppt格式，简要的介绍，适合初学者

精品课程推荐大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx: 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共...

大数据概述包括：大数据绪论，Hadoop简介，数据库技术历史和发展，分布式计算架构: 大数据概述包括：大数据绪论，Hadoop简介，数据库技术历史和发展，分布式计算架构

一、Hadoop简介和 Hadoop结构介绍: Hadoop是现阶段数据开发的基础，Hadoop通常是指一个更广泛的概念—-Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境) 是Apache公司使用Java语言编写的开源的，分布式系统的基础架构分布式就是，当储存...

福建师范大学精品大数据导论课程系列 (5.1.1)--4.1.1 hadoop简介之一.rar: 福建师范大学精品大数据导论课程系列 (5.1.1)--4.1.1 hadoop简介之一.rar

福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.rar: 福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.rar

Hadoop简介以及配置文件: Hadoop本身是由Yahoo!公司开发的后来贡献给了Apache的一套开源的、可靠的分布式架构 Hadoop提供了简单的编程模型能够对大量的数据进行分布式处理(The Apache Hadoop software library is a framework that allows ...

hadoop简介与安装: 简要介绍了hadoop的发展历程、原理、特征以及基于hadoop的分布式系统的安装方法。

Hadoop-0.21.0分布式集群配置: Hadoop-0.21.0分布式集群配置.doc

Global site tag (gtag.js) - Google Analytics