集群中节点的datanode无法启动（转） - cocoIT - ITeye博客

`

cocoIT

浏览: 48808 次
性别:
来自: 福建

最近访客更多访客>>

HincZhang

jack1007

画个逗号给明天qu

xiaoyulong1988

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (101)

社区版块

存档分类

最新评论

joyhen：感谢，要学的东西好多啊
Apache Hadoop生态系统
java大风车： fffffffffffffffffffffffffffff
Apache Hadoop生态系统

集群中节点的datanode无法启动（转）

阅读更多

转载：http://xiaoxia001.iteye.com/blog/1279354

用三台centos操作系统的机器搭建了一个hadoop的分布式集群。启动服务后失败，查看datanode的日志，提示错误：ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in /var/lib/hadoop-0.20/cache/hdfs/dfs/data: namenode namespaceID = 240012870; datanode namespaceID = 1462711424.

　　问题：Namenode上namespaceID与datanode上namespaceID不一致。

　　问题产生原因：每次namenode format会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有清空datanode下的数据,所以造成namenode节点上的namespaceID与datanode节点上的namespaceID不一致。启动失败。

　　解决办法：参考该网址http://blog.csdn.net/wh62592855/archive/2010/07/21/5752199.aspx 给出两种解决方法，我们使用的是第一种解决方法：即:

　　(1)停掉集群服务

　　(2)在出问题的datanode节点上删除data目录，data目录即是在hdfs-site.xml文件中配置的dfs.data.dir目录，本机器上那个是/var/lib/hadoop-0.20/cache/hdfs/dfs/data/ (注：我们当时在所有的datanode和namenode节点上均执行了该步骤。以防删掉后不成功，可以先把data目录保存一个副本).

　　(3)格式化namenode.

　　(4)重新启动集群。

　　问题解决。

　　这种方法带来的一个副作用即是，hdfs上的所有数据丢失。如果hdfs上存放有重要数据的时候，不建议采用该方法，可以尝试提供的网址中的第二种方法。

分享到：

mapreduce中map处理过程？参数如何解析传 ... | hadoop中的排序（转）

2013-11-15 16:55
浏览 466
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop集群datanode磁盘不均衡的解决方案: 因业务需要搭建一个新hadoop集群，并将老的hadoop集群中的数据迁移至新的hadoop集群，而且datanode节点不能全部上线，其中还可能会出现节点上线或下线的情况，这个时候就很容易出现机器与机器之间磁盘的均衡的情况，...

hadoop动态增加和删除节点方法介绍: 上一篇文章中我们介绍了Hadoop编程基于MR程序实现倒排索引示例的有关内容，这里我们看看如何在Hadoop中动态地增加和删除节点（DataNode）。假设集群操作系统均为：CentOS 6.7 x64 Hadoop版本为：2.6.3 一、动态...

Hadoop大数据平台构建、规划大数据平台集群教学课件.pptx: 在不同的节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程中的某几个。在一台服务器上使用虚拟机软件虚拟所有的节点，也属于完全分布模式，在一些数据量比较少的公司集群就是...

Hadoop-ha集群搭建: 集群部署节点角色的规划（3节点） ------------------ server01 namenode resourcemanager zkfc nodemanager datanode zookeeper journal node server02 namenode resourcemanager zkfc nodemanager datanode ...

hadoop集群基本进程: namenode 相当于一个领导者，负责调度比如你需要存一个640m的文件如果按照64m分块那么namenode就会把这10个块（这里不考虑副本）分配到集群中的datanode上并记录对于关系。当你要下载这个文件的时候namenode就...

Hadoop集群搭建教程1: 1. 检查ntp包是否安装 2. 设置时间配置文件 3. 设置BIOS与系统时间同步 4. 启动ntp服务并测试 1. 手动同步 2. 定时同步 1. 检查nt

【大数据处理技术实践】期末考查题目：集群搭建、合并文件与数据统计可视化: 采用虚拟机的方式搭建一个具有3个DataNode节点的HDFS集群，将搭建过程记录在实验报告中。采用虚拟机的方式，先配置好Hadoop的主节点，然后通过克隆的方式创建Slave节点，实现3节点的HDFS集群任务二：实验一：使用...

Hadoop平台搭建 1.搭建步骤文档 2.搭建时要用到的组件安装包: 启动Hadoop集群：启动Hadoop集群的各个节点，包括NameNode、SecondaryNameNode、DataNode等。用途：数据存储和处理：Hadoop可以存储海量数据，并使用MapReduce等编程模型进行数据处理和分析。数据挖掘和机器学习...

快速学习-DataNode: 第6章 DataNode（面试开发重点） 6.1 DataNode工作机制 DataNode工作机制，如图3-15所示。 1）一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据...4）集群运行中可

mac上基于docker搭建hadoop集群: 对各个节点指定好功能 maseter为主节点，hadoop01 为从节点和datanode hadoop02 为yarn主节点负责各个节点的资源调度, hadoop02，hadoop03为datanode节点 OS hostname IP Centos8 hadoop-master ...

大数据面试题-.docx: 27. 集群内每个节点都应该配 RAID，这样避免单磁盘损坏，影响整个节点运行。( ) 大数据面试题-全文共15页，当前为第4页。 28. 因为 HDFS 有多个副本，所以 NameNode 是不存在单点问题的。( ) 29. 每个 map 槽就是一...

实验一Hadoop大数据集群搭建: 5. 成功启动集群，且可通过jps命令查看各个虚拟机上活跃的节点（与实验要求一致），并可以正常访问对应的web页面。以上实验要求均完美实现，且对每一步操作做了详细的截图和文字记录，细致入微。

大数据平台常见面试题.pdf: a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker 注：haoop1.X 分析： hadoop 的集群是基于 master/slave 模式，namenode 和 jobtracker 属于 master，datanode 和 tasktracker属于 slave，master 只 ...

Hadoop集群搭建-完全分布式: site.xml（hadoop核心配置）hdfs-site.xml（分布式文件系统HDFS相关配置）mapred-site.xml（MapReduce相关配置）yarn-site.xml（Yarn相关配置）slaves文件（里面写从节点所在的主机名，会在这些主机上启动DataNode）...

还在为搭建集群的期末作业发愁吗？最简单的搭建hadoop+spark+hive大数据集群搭建文档.docx: 3-4节点，集群部署自己确定，比如集群涉及的多种角色namenode，secondary namenode, datanode,resourcemanager等的节点分配，并用表格形式给出。给出可访问的ip,用户名密码。（阿里云直接给公网ip，校园网需给公网和...

大数据开发笔试.docx: 它管理集群内的DataNode，当客户发送请求过来后，NameNode会根据Meta-data指定存储到哪些DataNode上，而其本身并不存储真实的数据。 2、 mr的工作原理答：当客户提交作业后，MapReduce库先把任务splits不同的块，...

CentOS下Hadoop-0.20.2集群配置文档: 集群包含三个节点：1 个namenode，2 个datanode，节点之间局域网连接，可以相互ping通，三台节点上均是CentOS系统，并且有一个相同的用户hadoop(具有管理员权限)！

大数据开发技术.pdf: 3．DataNode 它负责管理连接到节点的存储（一个集群中可以有多个节点）。每个存储数据的节点运行一个 datanode 守护进程。 4．ResourceManager（JobTracker） JobTracker 负责调度 DataNode 上的工作。每个 ...

【Hadoop离线基础总结】HDFS入门介绍: NameNode 是 HDFS 集群主节点，DataNode 是 HDFS 集群从节点。分块存储分块存储存在的原因：假如有100台机器，每台机器只有1T。现在有一个2T的文件，单独存放在一台机器上是无法实现的。那么分块存储就能

Global site tag (gtag.js) - Google Analytics