`

hadoop各配置文件加载情况

阅读更多

之前依据名字想当然的把fs.default.name配置在hdfs-site.xml里,结果执行ls copy等命令都是本地的方式,后调试也未果,故想了下之前自己的操作,然后看了下代码发现都是配置惹的问题,故在此总结下各配置项的加载情况。

在hadoop 0.20.2版本中存在如下几个配置文件

Java代码   收藏代码
  1. core- default .xml  
  2. core-site.xml  
  3.   
  4. hdfs-default .xml  
  5. hdfs-site.xml  
  6.   
  7. mapred-default .xml  
  8. mapred-site.xml  

 其中default中各个配置项可以参看我之前的blog里有说。下面总结下加载情况

在Configuration类中通过static加载方式加载了

Java代码   收藏代码
  1. core- default .xml  
  2. core-site.xml  

也就是说所有用到Configuration的类都会加载这个配置项。

在以下几个类中会显示加载hdfs-*.xml

Java代码   收藏代码
  1. DataNode  
  2. NameNode  
  3. DFSck  
  4. DistributedFileSystem  

 这几个类加载这些文件是通过Configuration来完成的,也就是说默认会将core-*的xml也加载进来。

以下几个类中会显示加载mapred-*.xml

Java代码   收藏代码
  1. JobClient  
  2. JobConf  
  3. JobTracker  
  4. TaskTracker  

 同样他们的操作也是由Configuration来完成的,也就是说默认会将core-*的xml也加载进来

 

在hadoop命令中有以下类是执行命令的实体类

Java代码   收藏代码
  1. namenode                    CLASS=org.apache.hadoop.hdfs.server.namenode.NameNode  
  2. secondarynamenode    CLASS=org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode  
  3. datanode                     CLASS=org.apache.hadoop.hdfs.server.datanode.DataNode  
  4. fs                                 CLASS=org.apache.hadoop.fs.FsShell  
  5. dfs                               CLASS=org.apache.hadoop.fs.FsShell  
  6. dfsadmin                      CLASS=org.apache.hadoop.hdfs.tools.DFSAdmin  
  7. mradmin                       CLASS=org.apache.hadoop.mapred.tools.MRAdmin  
  8. fsck                              CLASS=org.apache.hadoop.hdfs.tools.DFSck  
  9. balancer                       CLASS=org.apache.hadoop.hdfs.server.balancer.Balancer  
  10. jobtracker                    CLASS=org.apache.hadoop.mapred.JobTracker  
  11. tasktracker                   CLASS=org.apache.hadoop.mapred.TaskTracker  
  12. job                               CLASS=org.apache.hadoop.mapred.JobClient  
  13. queue                           CLASS=org.apache.hadoop.mapred.JobQueueClient  
  14. pipes                            CLASS=org.apache.hadoop.mapred.pipes.Submitter  
  15. version                         CLASS=org.apache.hadoop.util.VersionInfo  
  16. jar                                CLASS=org.apache.hadoop.util.RunJar  
  17. distcp                           CLASS=org.apache.hadoop.tools.DistCp  
  18. daemonlog                   CLASS=org.apache.hadoop.log.LogLevel  
  19. archive                         CLASS=org.apache.hadoop.tools.HadoopArchives  
  20. sampler                        CLASS=org.apache.hadoop.mapred.lib.InputSampler  

 也就是说从这些类中排除上面那些显示指定hdfs,mapred等配置项的类,那么这些剩余的类使用的配置都是从

Java代码   收藏代码
  1. core- default .xml  
  2. core-site.xml  

获得,所以如果你有针对以上类中需要使用的特定配置而不是使用系统默认的配置,那么需要配置在core-site.xml中,例如fs.default.name

更多信息请查看 java进阶网 http://www.javady.com

分享到:
评论

相关推荐

    ubuntu 下的Hadoop配置与运行

    记录了Ubuntu下的Hadoop的配置与运行 ,经典例子

    Hadoop configuration files:Hadoop配置文件-开源

    Hadoop 1.x和2.x配置文件以及一些其他文件来配置Hadoop集群

    hadoop-0.20.2(已经修改了conf文件中的默认配置)

    hadoop-0.20.2(已经修改了conf文件中的默认配置),直接解压即可,适用于windows的eclipse开发和linux端的服务器部署。

    Hadoop完全分布式配置.txt

    当配置文件为空时,Hadoop会完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。 b. 伪分布模式 Hadoop守护进程...

    高可用性的HDFS:Hadoop分布式文件系统深度实践

    3.1.1 NameNode启动加载元数据情景分析 3.1.2 元数据更新及日志写入情景分析 3.1.3 Checkpoint过程情景分析 3.1.4 元数据可靠性机制 3.1.5 元数据一致性机制 3.2 使用说明 第4章 Hadoop的Backup Node方案 4.1 Backup...

    Hadoop权威指南 第二版(中文版)

     Hadoop配置  配置管理  环境设置  Hadoop守护进程的关键属性  Hadoop守护进程的地址和端口  Hadoop的其他属性  创建用户帐号  安全性  Kerberos和Hadoop  委托令牌  其他安全性改进  利用基准测试程序...

    Nutch_的配置文件

    Nutch的配置文件主要有三类: 1.Hadoop的配置文件,Hadoop-default.xml和Hadoop-site.xml。...3.Nutch的插件的配置文件,这些插件的配置文件在加载插件的时候由插件自行加载,如filter的配置文件。

    重新编译好的contain-executor文件,指向/etc/hadoop/container-executor.cfg

    所以需要重新编译Container-executor,这边提供重新编译好的,默认加载配置文件路径/etc/hadoop/container-executor.cfg 使用方法: 1 替换/$HADOOP_HOME/bin/下的container-executor 2 创建/etc/hadoop目录,并将...

    Hadoop权威指南(中文版)2015上传.rar

    Hadoop配置 配置管理 环境设置 Hadoop守护进程的关键属性 Hadoop守护进程的地址和端口 Hadoop的其他属性 创建用户帐号 安全性 Kerberos和Hadoop 委托令牌 其他安全性改进 利用基准测试程序测试Hadoop集群 Hadoop基准...

    Hadoop实战手册

    Hadoop 单机系统 安装配置13#Hadoop 文件下载和解压13#配置 hadoop-env.sh 环境变量13#Hadoop Common组件 配置 core-site.xml13#HDFS NameNode,DataNode组建配置 hdfs-site.xml14#配置MapReduce - JobTracker ...

    Hadoop实战(第2版)

    11.2.1 加载数据技术点67 加载Apache 日志文件11.2.2 过滤和投影技术点68 通过过滤和投影减少数据处理量11.2.3 分组和聚合UDF 技术点69 IP 地址的分组和计数 11.2.4 使用UDF 进行定位技术点70 使用...

    flink安装所需要的第三方jar

    flink安装所需要的第三方jar,即flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

    Hadoop大数据从入门到精通

    Hadoop分布式文件系统(HDFS)和MapReduce的工作原理 如何优化Hadoop机群所需要的硬件配置 搭建Hadoop机群所需要考虑的网络因素 如何利用Hadoop配置选项进行系统性能调优 如何利用FairScheduler为多用户提供服务级别...

    HadoopHA高可用完全分布式搭建

    在四台节点上配置好JDK、Hadoop以及ZookeeperZookeeper环境变量并重新加载profile文件 三、配置免密钥 免密钥场景1: 将node01作为管理节点的启动脚本,需要配置node01节点免密钥登录其他三台节点 免密钥场景2: ...

    Hadoop硬实战 [(美)霍姆斯著][电子工业出版社][2015.01]_PDF电子书下载 带书签目录 高清完整版.rar )

    1.2.2 Hadoop 的配置 1.2.3 CLI 基本命令 1.2.4 运行MapReduce 作业 1.3 本章小结 第2 部分 数据逻辑. 2 将数据导入导出Hadoop. 2.1 导入导出的关键要素 2.2 将数据导入Hadoop . 2.2.1 将...

    hive3资源包+安装文档

    hive 底层封装了Hadoop ,使用类SQL 的hiveSQL 语言实现数据查询,所有hive 的数据都存储在Hadoop 兼容的文件系统(例如,Amazon S3、HDFS)中。hive 在加载数据过程中不会对数据进行任何的修改,只是将数据移动到...

    hadoop集群基本进程

    QuorumPeerMain Zookeeper集群启动的入口类是QuorumPeerMain来加载配置启动QuorumPeer线程。首先我们来看下QuorumPeer, 谷歌翻译quorum是法定人数,定额的意思, peer是对等的意思,那么QuorumPee

    利用Hive进行复杂用户行为大数据分析及优化案例

    11_Hadoop中编译配置Snappy压缩 12_Hadoop及Hive配置支持snappy压缩 13_Hive中的常见调优 14_Hive中的数据倾斜及解决方案-三种join方式 15_Hive中的数据倾斜及解决方案-group by 16_Hive中使用正则加载数据 17_Hive...

    docker-spark-ipython:带有 ipython 的 spark docker 图像

    #spark-ipython ##这是什么图? 此图像包含单节点配置中的 spark(来自 sequenceiq/docker-spark),ipython notebook。 ##如何使用这张图片?...在容器内部,使用 hdfs/hadoop cmd 将文件加载到 hdfs。

Global site tag (gtag.js) - Google Analytics