`
shiqidide
  • 浏览: 64453 次
文章分类
社区版块
存档分类
最新评论

Hadoop 集群常见错误

 
阅读更多

原文链接:http://www.open-open.com/lib/view/open1330946781999.html

这里将自己在初识hadoop过程中遇到的一些错误做一个简单总结:

(一)启动hadoop集群时易出现的错误:

1. 错误现象:java.net.NoRouteToHostException: No route to host.

原因:master服务器上的防火墙没有关闭。

解决方法: 在master上关闭防火墙: chkconfig iptables off.

2.错误现象:org.apache.hadoop.ipc.RPC: Server at JMN/10.22.1.203:9000 not available yet. /* JMN/10.22.1.203 是 hadoop集群当中master的主机名/ip */

原因/etc/hosts中的文件被自动篡改。

解决方法: /etc/hosts 文件按配置文件要求改回来。

3.错误现象Too many fetch-failures.

原因:结点间的连通不够全面。

解决方法:

1) 检查 /etc/hosts要求本机ip对应服务器名,并且包含所有的服务器ip和服务器名。

2) 检查 .ssh/authorized_keys要求包含所有服务器(包括其自身)的public key。

(二)在hadoop集群的master中用命令运行例子易出现的故障:

1.错误现象:java.lang.OutOfMemoryError: Java heap space.

原因:JVM内存不够。

解决方法:修改mapred-site.xml中mapred.child.java.opts属性的值,其默认值是-Xmx200m 可根据需要适当增大 该值。

2.错误现象:could only be replicated to 0 nodes, instead of 1

解决方法:在NameNode上执行命令:hadoop namenode –format重新格式化HDFS,在格式化之前,需要将你 NameNode上所配置的dfs.name.dir这一namenode用来存放NameNode 持久存储名字空间及事务日志的本地文件系统路径删除,同时将各DataNode上的dfs.data.dir的路径DataNode存放块数据的本地文件系统路径的目录也删除。

3. 错误现象namenode in safe mode.

原因:hadoop进入安全模式。

解决方法:在shell中执行命令hadoop dfsadmin -safemode leave 使hadoop离开安全模式。

(三)在windows下Eclipse中运行例子易出现的错误:

1. 错误现象:org.apache.hadoop.security.AccessControlException: Permission denied: user=administrator, access=EXECUTE, inode="job_201111031322_0003":heipark:supergroup:rwx-.

原因:本地用户administrator(本机windows用户)想要远程操作hadoop系统,没有权限引起的。

解决办法:

i、如果是测试环境,可以取消hadoop hdfs的用户权限检查。打开conf/hdfs-site.xml,找到dfs.permissions属性修改为false(默认为true)OK了。

ii、修改hadoop location参数,在advanced parameter选项卡中,找到hadoop.job.ugi项,将此项改为启动hadoop的用户名即可。

2.错误现象:IOException: Cannot run program "chmod": CreateProcess error=2.

原因: 没有安装cygwin或 没有配置环境变量。
解决办法:安装并配置环境变量 bin到 path下 重启 eclipse 问题即可。

3. 错误现象: WARN mapred.LocalJobRunner: job_local_0001
java.lang.OutOfMemoryError: Java heap space
at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask.java:781)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:350)
………..

原因:客户端程序运行时java虚拟机内存分配不够

解决办法:修改run configuration,选择Arguments选项卡,在VM arguments栏中加入-Xmx1024m,保存即可解决问题。


分享到:
评论

相关推荐

    Hadoop集群常见错误收集.doc

    Hadoop集群常见错误收集.doc 常见错误收集

    Hadoop集群搭建(全)

    从配置Linux IP 到hadoop集群安装的详细步骤附带linux命令,最后总结安装中常见的错误,以及处理办法。

    Hadoop集群的配置及常见问题总结

    NULL 博文链接:https://shirley-ren.iteye.com/blog/1174622

    Hadopp集群运用过程中碰到的问题

    hadoop集群常见错误:(一)启动hadoop集群时易出现的错误:(二) 在hadoop集群的master中用命令运行例子易出现的故障:(三)在windows下Eclipse中运行例子易出现的错误:

    大数据技术之-03-Hadoop学习-Hadoop运行模式及常见错误及解决方案.docx

    大数据技术之 Hadoop 运行模式及常见错误及解决方案 Hadoop 运行模式是大数据技术中的一个重要概念,它决定了 Hadoop 集群的运行方式和性能。在本文中,我们将详细介绍 Hadoop 的三种运行模式:本地运行模式、伪...

    Hadoop伪分布式集群环境搭建

    Hadoop伪分布式集群环境搭建,有常见错误及解决方案。

    windows下Hadoop配置

    3. 集群节点配置错误:集群节点的配置错误可能导致 Hadoop 集群无法正常运行。 结论 Windows 下 Hadoop 配置是一个复杂的过程,需要了解 Hadoop 的基本概念、配置文件和集群配置等知识。本文详细介绍了 Windows 下...

    Hadoop集群的搭建.docx

    常见的启动错误 错误:启动完后,namenode的主机上没有出现namenode进程。 原因:没有进行namenode初始化。只初始化一次,以后不要初始化了。 错误:启动完后,datanode的主机上没有出现datanode进程。或者出现了...

    hadoop常见错误以及处理方法详解

    1、hadoop-root-datanode-master.log 中有如下错误:ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in导致datanode启动不了。原因:每次namenode format...

    Hadoop实战手册

    启动执行和异常检查17#通过界面查看集群部署部署成功18#通过执行 Hadoop pi 运行样例检查集群是否成功19#安装部署 常见错误207. Hadoop 集群系统 配置安装配置20#检查node节点linux 基础环境是否正常,参考 [ linux ...

    第3章 Hadoop 2 3.1. 简介 2 3.1.1. 概述 2 3.2. 环境搭建 2 3.2.1. 搭建过程总览 2

    第3章 Hadoop 2 3.1. 简介 2 3.1.1. 概述 2 3.2. 环境搭建 2 3.2.1. 搭建过程总览 2 3.2.2. 集群规划 3 ...3.3. 常见错误解决方法 36 3.3.1. 查看日志 36 3.3.2. 无法启动hadoop集群的检查方法 37 3.3.3. 执行jps

    Hadoop实战(第2版)

    Hadoop是一个开源的MapReduce平台,设计运行在大型分布式集群环境中,提供查询和分析服务。尤其适用于大数据系统,Hadoop为苹果、eBay、LinkedIn、雅虎和Facebook等公司提供重要软件环境。它为开发者进行数据存储、...

    22_尚硅谷大数据之MapReduce_常见错误及解决方案1

    尚硅谷大数据之MapReduce_常见错误及解决方案 MapReduce是大数据处理的核心组件,但是在实际应用中,常常会遇到各种错误和问题。下面是常见的10个错误及解决方案: 1. 导包容易出错,尤其是Text和...

    集群搭建手册_CDH5.13.1版.docx

    整理企业级Hadoop_CDH集群的搭建步骤和常见问题解决方案,包括环境配置,安装步骤和使用方法,最后将搭建过程中的常见错误做了总结和解释

    Hadoop学习笔记(一)Hadoop快速入门:1.完全分布式运行模式

    准备、过程 虚拟机:VMware Workstation 12 Pro 操作系统:CentOS Linux release 7.2.1511 ...常见错误及解决方案 虚拟机准备 请参考文章: Cent OS 7系统的安装、VMware Tools安装及设置共享文件夹 虚拟机中克隆

    Spark RDD详解

    它可以通过YARN或Spark的Standalone在Hadoop集群中运行,并且可以处理HDFS、Hbase、Cassandra、Hive和任何Hadoop InputFormat中的数据。它旨在执行批处理(类似于MapReduce)和提供新的工作特性,例如流计算,SparkSQL...

    阿里云E-MapReduce-常见问题指南-D.docx

    本资源摘要信息将对阿里云E-MapReduce的常见问题进行总结,涵盖了作业和执行计划的区别、作业日志的查看、集群和执行计划的计时策略、读写ODPS时的错误处理、ConsumerID消费同一个Topic时的TPS不一致问题、查看作业...

Global site tag (gtag.js) - Google Analytics