[转] hadoop使用中的几个小细节(二) - IT进行时 - ITeye博客

`

itstarting

浏览: 147035 次
性别:
来自: 杭州

最近访客更多访客>>

sp42

黑小子

winting

yeyeyeid

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

fei33423：流程引擎的流转比状态机要复杂太多了把. 我觉得你即可以看成平行 ...
工作流引擎是否应该建立在有限状态机（Finite State Machine, FSM）引擎之上？
c601097836：为什么你们都说FSM,而不是UML State machine ...
工作流引擎是否应该建立在有限状态机（Finite State Machine, FSM）引擎之上？
ronghao： di1984HIT 写道类似啊，我现在也有这个困惑、我的工作流 ...
工作流引擎是否应该建立在有限状态机（Finite State Machine, FSM）引擎之上？
di1984HIT：不错啊。学习了。
[转]hadoop使用中的几个小细节(一)
di1984HIT：好的、
工作流20种基本模式的理解

[转] hadoop使用中的几个小细节(二)

博客分类：

hadoop及云计算

Hadoop Linux Java Apache Mapreduce

阅读更多

[转] hadoop使用中的几个小细节(二)

转自：http://rdc.taobao.com/blog/dw/archives/245

十二月 07, 2008 By: 竹庄 Category: hadoop, 所有

1 某次正常运行mapreduce实例时,抛出错误

java.io.IOException: All datanodes xxx.xxx.xxx.xxx:xxx are bad. Aborting…

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.processDatanodeError(DFSClient.java:2158)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.access$1400(DFSClient.java:1735)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:1889)

java.io.IOException: Could not get block locations. Aborting…

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.processDatanodeError(DFSClient.java:2143)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.access$1400(DFSClient.java:1735)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:1889)

经查明，问题原因是linux机器打开了过多的文件导致。用命令ulimit -n可以发现linux默认的文件打开数目为1024，修改/ect/security/limit.conf，增加hadoop soft 65535

再重新运行程序（最好所有的datanode都修改），问题解决

P.S:据说hadoop dfs不能管理总数超过100M个文件，有待查证

2 运行一段时间后hadoop不能stop-all.sh的问题，显示报错

no tasktracker to stop ，no datanode to stop

问题的原因是hadoop在stop的时候依据的是datanode上的mapred和dfs进程号。而默认的进程号保存在/tmp下，linux默认会每隔一段时间（一般是一个月或者7天左右）去删除这个目录下的文件。因此删掉hadoop-hadoop-jobtracker.pid和hadoop-hadoop-namenode.pid两个文件后，namenode自然就找不到datanode上的这两个进程了。

在配置文件中的export HADOOP_PID_DIR可以解决这个问题

分享到：

《Hadoop-0.20.1+Ubuntu实战》即将出炉 | [转]hadoop使用中的几个小细节(一)

2009-11-16 15:16
浏览 1550
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop几个实例: 网上很难找的hadoop代码，很适合初学或想从事大数据方向的程序猿，心动者赶紧下载。

Hadoop 2.7.1 中文文档: Hadoop 2.7.1 中文文档 Hadoop 2.7.1 中文文档 Hadoop 2.7.1 中文文档

hadoop2.7中文文档: hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文...

Hadoop2.7.1中文文档: Hadoop2.7.1中文文档

Hadoop权威指南中文版（第二版）+Hadoop in Action: Hadoop权威指南中文版（第二版）+Hadoop in Action（英文版） + pro Hadoop（英文版）

hadoop 二次排序原理: Hadoop 大数据方向 mapreduce计算中的二次排序，讲解透彻

Hadoop使用常见问题以及解决方法: Hadoop使用常见问题以及解决方法，简单实用

hadoop2.7.3 hadoop.dll: 在windows环境下开发hadoop时，需要配置HADOOP_HOME环境变量，变量值D:\hadoop-common-2.7.3-bin-master，并在Path追加%HADOOP_HOME%\bin，有可能出现如下错误： org.apache.hadoop.io.nativeio.NativeIO$Windows....

Hadoop权威指南中文版: 全书共14章，3个附录，涉及的主题包括：haddoop简介：mapreduce简介：hadoop分布式文件系统；hadoop的i／o、mapreduce应用程序开发；mapreduce的工作机制：mapreduce的类型和格式；mapreduce的特性：如何安装hadoop...

Hadoop权威指南第二版(中文版): 　使用Hadoop分析数据　map阶段和reduce阶段　横向扩展　合并函数　运行一个分布式的MapReduce作业　Hadoop的Streaming 　Ruby版本　Python版本　Hadoop Pipes 　编译运行第3章 Hadoop分布式文件系统　HDFS...

hadoop 使用 maven3.3 仓库 7: hadoop 使用 maven3.3 仓库 5hadoop 使用 maven3.3 仓库 7

hadoop使用distcp问题解决: hadoop使用distcp问题解决然后用distcp从1.0.3的集群拷数据到2.0.1的集群中。遇到问题处理

Hadoop下载 hadoop-3.3.3.tar.gz: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不...

hadoop2.6.5中winutils+hadoop: windows系统开发hadoop包需要的winutils.exe和hadoop.dll文件

深入理解Hadoop（第二版）: 本书详细地讲述了Hadoop生态圈中最为重要的几个组件。不仅介绍了Hadoop涉及的分布式理论基础知识，还着重讲解Hadoop系统的工程实践应用。为了深入浅出地讲述Hadoop各个组件的运行机理，作者使用了贴切的实战用例

使用Hadoop构建云计算平台: 资源名称：使用Hadoop构建云计算平台内容简介：• 核心框架： HDFS和MapReduce• MapReduce — 任务的分解与结果的汇总• HDFS — Hadoop Distributed File System• — 分布式计算的基石Hadoop是一个Apache的开源...

hadoop需要注意几个组件端口: ambari离线安装hadoop,及其它组件，配置文件中产看相关ip及端口号

hadoop 使用 maven3.3 仓库 3: hadoop 使用 maven3.3 仓库3

hadoop使用手册: 全面教你在Linux上使用hadoop 启动与关闭启动HADOOP 1. 进入HADOOP_HOME目录。 2. 执行sh bin/start-all.sh 单个起：/opt/hadoop-1.0.3/bin/hadoop-daemon.sh start datanode /opt/hadoop-1.0.3/bin/hadoop-...

使用docker部署hadoop集群的详细教程: 目标：使用docker搭建一个一主两从三台机器的hadoop2.7.7版本的集群准备：首先要有一台内存8G以上的centos7机器，我用的是阿里云主机。其次将jdk和hadoop包上传到服务器中。我安装的是hadoop2.7.7。包给大家准备...

Global site tag (gtag.js) - Google Analytics