hadoop-job-mapreduce培训遗留问题 - 紫极香随 - ITeye博客

`

younglibin

浏览: 1193184 次
性别:
来自: 北京

最近访客更多访客>>

u010277881

Asdpboy

yhtppp

java_dotar_01

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

pjwqq： “子类对象”都拥有了“父类对象的一个实例的引用”我晕,应该是“ ...
java继承--父类属性的存放位置
gwgyk：关于楼主最后的问题，我想可能是这样：InputFormat默认 ...
eclipse 运行hadoop wordcount
fanjf：上述7点基本具备，可惜现在因为项目需要，做管理方面工作！
如何判断自己是否具有成为一名优秀程序员的潜质
摸爬滚打NO1：链接已经失效
Eclipse添加JSEclipse 插件（js插件）
younglibin：看了以上7条，自己也不知道是否能够对上，感觉没一点都有那 ...
如何判断自己是否具有成为一名优秀程序员的潜质

hadoop-job-mapreduce培训遗留问题

博客分类：

待处理问题
hadoop

阅读更多

1.map的num是可以配置的，但是最终map的数量是由谁来决定的？map num?

在splite代码中，我们看到了 map的数量由块的数量来决定，那么这里配置的这个数量到底是谁来决定的？

2.second namenode?

second namenode 的是一个冷备份，如果namenode 节点出现故障的话，启动 second namenode 是不是可以是整个hadoop集群正常工作，个人认为是可以的？待查资料？

3.block 是不是均匀分布在各个datanode？

举个例子，加入默认块的大小是 64M 我有10个节点，那么对一个640M 的文件做mapreduce是不是每个节点都会得到64M 这么一个块？个人认为是可以的？待查资料？

4.map的结果和reduce的输入都做了sort，为什么要做sort？

其实有些程序是不需要做排序的，但是mapreduce默认实现了sort，为什么要做sort呢？

难道是仅仅简单的排序吗？sort是非常消耗性能的一件事情？待查资料？

这是本次遇到的一些问题？

分享到：

查看当前jvm运行的线程 | hadoop在文件分片blocksize

2013-08-28 15:55
浏览 973
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop 3.x（MapReduce）----【MapReduce 概述】---- 代码: Hadoop 3.x（MapReduce）----【MapReduce 概述】---- 代码 Hadoop 3.x（MapReduce）----【MapReduce 概述】---- 代码 Hadoop 3.x（MapReduce）----【MapReduce 概述】---- 代码 Hadoop 3.x（MapReduce）----...

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop-mapreduce-examples-2.7.1.jar: hadoop-mapreduce-examples-2.7.1.jar

hadoop最新版本3.1.1全量jar包: hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

hadoop-mapreduce-client-core-2.5.1-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.5.1.jar；赠送原API文档：hadoop-mapreduce-client-core-2.5.1-javadoc.jar；赠送源代码：hadoop-mapreduce-client-core-2.5.1-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop-mapreduce-client-app-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-app-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.6.5-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-app-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-app-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.6.5-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-app-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-app-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.7.3-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-core-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-core-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-core-2.7.3-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-common-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-common-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-common-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-common-2.6.5-sources.jar；赠送Maven依赖信息...

hadoop-mapreduce-client-core-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.6.5.jar 赠送原API文档：hadoop-mapreduce-client-core-2.6.5-javadoc.jar 赠送源代码：hadoop-mapreduce-client-core-2.6.5-sources.jar 包含翻译后的API文档：...

Hadoop-0.20.0-HDFS+MapReduce+Hive+HBase十分钟快速入门: Hadoop-0.20.0-HDFS+MapReduce+Hive+HBase十分钟快速入门

hadoop-mapreduce-examples-2.6.5.jar: hadoop-mapreduce-examples-2.6.5.jar 官方案例源码

hadoop-mapreduce-examples-2.6.0: Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据...

hadoop-3.3.4 版本（最新版）: Apache Hadoop （hadoop-3.3.4.tar.gz）项目为可靠、可扩展的分布式计算开发开源软件。官网下载速度非常缓慢，因此将hadoop-3.3.4 版本放在这里，欢迎大家来下载使用！ Hadoop 架构是一个开源的、基于 Java 的编程...

03-Hadoop-MapReduce.docx: 尚硅谷大数据技术之Hadoop-Mapreduce

hadoop-eclipse-plugin-1.2.1.jar有用的: 该资源包里面包含eclipse上的hadoop-1.2.1版本插件的jar包和hadoop-1.2.1.tar.gz，亲测可用~~请在下载完该包后解压，将hadoop-1.2.1...preferences ,browser选择D:\hadoop-eclipse，配置Hadoop MapReduce的安装路径。

Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码: Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop ...

hadoop-mapreduce-client-common-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-common-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-common-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-common-2.7.3-sources.jar；赠送Maven依赖信息...

Global site tag (gtag.js) - Google Analytics