Hadoop的data.dir配置导致balancer无法平衡各节点 - BlackWing - ITeye博客

`

BlackWing

浏览: 196540 次
性别:
来自: 广州

最近访客更多访客>>

yr_zhang

haeng

dotjar

swu45

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

永立s：这篇博客帮我解决了一个问题,十分感谢.
HBase表增加snappy压缩
BlackWing：日志是job运行日志，看你怎么配置了，一般就在hadoop安装 ...
解决Exception from container-launch: ExitCodeException exitCode=1的另类错误
heymaomao： heymaomao 写道有两个问题，想请教下楼主第一是日志楼 ...
解决Exception from container-launch: ExitCodeException exitCode=1的另类错误
heymaomao：有两个问题，想请教下楼主第一是日志楼主到底看的是哪个日志文件 ...
解决Exception from container-launch: ExitCodeException exitCode=1的另类错误
atomduan：本地的Unix 进程创建失败，检查下服务器内存是否够用，是不是 ...
解决Exception from container-launch: ExitCodeException exitCode=1的另类错误

Hadoop的data.dir配置导致balancer无法平衡各节点

博客分类：

Linux
hadoop

hadoop balancer

阅读更多

hdfs的data.dir配置如下：

<property>
  <name>dfs.data.dir</name>
  <value>/diska/data/hadoop/data1,/diska/data/hadoop/data2</value>
 </property>

后来在web界面的live nodes中看到，怎么hadoop配置的可用空间比实际的空间要多一倍，所以推测，hadoop不会检测是否相同的盘，只单独计算data.dir配置的每个目录的总容量，简单相加。

因为要运行balancer，但发现log显示信息都正确，也表明要copy block到比较均衡的机器，但实际上却没有发生block的拷贝。

把data.dir修改正确后，balancer能正确均衡集群了。

bin/start-balancer.sh默认的一个判断是否均衡的阀值是10%，也就是说，各个节点间使用率的偏差不超过10%。

PS: hadoop中第dfs.replication设置第数量如果跟机器数一样，则也不能balance，因为这时每台机都已经有一个拷贝，就不会在复制。

从balancer的后台输出中看到，移动block时总是from ... to ... through ...，也就是说，会以一台中间节点来转移数据，但这只是表面看到的情况，实际情况是，through的这台节点，其实是包含要移动block的一个copy，并且是已经balanced的节点。这样的话，移动block就不必真的从非balanced的节点移动，减轻了要移动block的节点第压力。

分享到：

Hadoop使用lzo压缩输出 | Linux下too many open files问题

2012-07-26 17:25
浏览 2251
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

适合hadoop2.9.* 以及 hadoop2.7.* 的winutils.exe_hadoop.dll 配置文件: 分别取对应的文件夹下解压，之后将这两个文件替换到 hadoop-2.*.*/bin目录下即可 winutils.exe、hadoop.dll

hadoop1.x与hadoop2.x配置异同: 英文的,讲解hadoop1.x与hadoop2.x配置异同

hadoop2.X新特性介绍: hadoop2.X新特性介绍

hadoop2.7.3 hadoop.dll: 在windows环境下开发hadoop时，需要配置HADOOP_HOME环境变量，变量值D:\hadoop-common-2.7.3-bin-master，并在Path追加%HADOOP_HOME%\bin，有可能出现如下错误： org.apache.hadoop.io.nativeio.NativeIO$Windows....

hadoop2.x主要配置: 包含了hadoop配置文件core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml

spark-2.3.4-bin-hadoop2.7.tgz: pyspark本地的环境配置包，spark-2.3.4-bin-hadoop2.7.tgz：spark-2.3.4-bin-hadoop2.7.tgz

spark-3.1.3-bin-hadoop3.2.tgz: Apache Spark版本3.1.3。Linux安装包。spark-3.1.3-bin-hadoop3.2.tgz

spark-3.1.2-bin-hadoop3.2.tgz: spark3.1.2适用于scala2.12+hadoop3.x

spark-3.0.0-bin-hadoop2.7.tgz: spark-3.0.0-bin-hadoop2.7.tgz 官网下载不了的，需要资源的，可以到这里下载哦

hadoop2.6.0 hadoop.dll包括winutils.exe: hadoop2.6.0 hadoop.dll包括winutils.exe

Hadoop2.x HA环境搭建: Hadoop2.x HA环境搭建Hadoop2.x HA环境搭建Hadoop2.x HA环境搭建

hadoop的winutils.exe及hadoop.dll文件: 我的报错：Could not locate Hadoop executable: E:\big_data\hadoop-3.3.0\bin\winutils.ex hadoop的winutils.exe及hadoop.dll文件,可以用于hadoop3.3. 下载好直接将两个文件复制到我们hadoop的bin目录下就行了

Hadoop.Essentials.1784396680: MapReduce, HDFS, and other Hadoop ecosystem components, you will soon learn many exciting topics such as MapReduce patterns, data management, and real-time data analysis using Hadoop. You will also ...

hadoop的hadoop.dll和winutils.exe下载: hadoop的hadoop.dll和winutils.exe下载

Hadoop3.x系统文档: Hadoop3.x系统文档Hadoop3.x系统文档Hadoop3.x系统文档

spark-assembly-1.6.1-hadoop2.6.0.jar: spark-assembly-1.6.1-hadoop2.6.0.jar,欢迎下载，，，，，，，，，，，，，，，，，，，，

多节点Hadoop配置.doc: 多节点Hadoop配置.doc 多节点Hadoop配置.doc

单节点Hadoop配置.doc: 单节点Hadoop配置.doc 单节点Hadoop配置.doc

hadoop2.7.3 Winutils.exe hadoop.dll: hadoop2.7.3 Winutils.exe hadoop.dll

hadoop0.23.9离线api: org.apache.hadoop.tools.rumen.datatypes.util org.apache.hadoop.tools.rumen.serializers org.apache.hadoop.tools.rumen.state org.apache.hadoop.tools.util org.apache.hadoop.typedbytes org.apache....

Global site tag (gtag.js) - Google Analytics