`

Hadoop之JobTracker,TaskTracker,Scheduler

 
阅读更多
DataNode 和NameNode 是针对数据存放来而言的

JobTracker和TaskTracker是对于MapReduce执行而言的

一:JobTracker

JobTracker协作作业的运行:
负责调度分配每一个子任务task运行于TaskTracker上,如果发现有失败的task就重新分配其任务到其他节点。

一般情况应该把JobTracker部署在单独的机器上。JobTracker与TaskTracker把持心跳;

JobTracker失败:

1:JobTracker失败在所有的失败中是最严重的一种;

2:hadoop没有处理jobtracker失败的机制。--它是一个单点故障。

3:在未来的新版本中可能可以运行多个JobTracker。(hadoop2.0以后)

4:可以使用ZooKeeper来协作JobTracker。(以后会有zookeeper专题)

二:TaskTracker

TaskTracker运行作业划分后的任务
TaskTracker是运行在多个节点上的slaver服务。
TaskTracker主动与JobTracker通信,接收作业,并负责直接
执行每一个任务,为了减少网络带宽TaskTracker最好运行在HDFS的DataNode上


TaskTracker失败:

1:一个TaskTracker由于崩溃或运行过于缓慢而失败,它会向JobTracker发送“心跳”。

2:如果有未完成的作业,JobTracker会重新把这些任务分配到其他的TaskTracker上面运行。

3:即使TaskTracker没有失败也可以被JobTracker列入黑名单。

三:hadoop调度器 Hadoop Job Scheduler
Hadoop默认的调度器是基于队列的FIFO调度器:
    所有用户的作业都被提交到一个队列中,然后由JobTracker先按照作业的优先级高低,再按照作业提交时间的先后顺序选择将被执行的作业。

优点:调度算法简单明了,JobTracker工作负担轻。
缺点:忽略了不同作业的需求差异。

Fair Scheduler(公平调度器):

1:多个Pool,Job需要被提交到某个Pool中;

2:每个pool可以设置最小 task slot(猜测最小的job数),称为miniShare

3:FS会保证Pool的公平,Pool内部支持Priority(优先级)设置,支持资源抢占(优先级)


转自:http://www.cnblogs.com/zhanghuijunjava/archive/2013/04/23/3036497.html

分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    hadoop1.0 Failed to set permissions of path 解决方案

    hadoop 启动时 TaskTracker无法启动 ERROR org.apache.hadoop.mapred.TaskTracker: Can not start task tracker because java.io.IOException: Failed to set permissions of path: \tmp\hadoop-admin \mapred\...

    【大数据】Hadoop常用启动命令.pdf

    mapred.sh 停⽌Hadoop MapReduce守护进程JobTracker和TaskTracker hadoop-daemons.sh start jobtracker 单独启动JobTracker守护进程 hadoop-daemons.sh stop jobtracker 单独停⽌JobTracker守护进程 hadoop-daemons....

    hadoop-0.21.0-fairscheduler.jar

    hadoop-0.21.0-fairscheduler.jar

    JobTracker:Hadoop JobTracker OS X 菜单栏应用程序

    Hadoop JobTracker 的 Mac 菜单栏应用程序界面。 它使您可以轻松访问 JobTracker 中的作业,并提供有关开始、完成和失败作业的 Growl/通知中心通知。 请参阅了解更多信息并下载二进制文件。 如果您有任何问题或...

    Apache Ooize Workflow Scheduler for Hadoop

    apache oozie workflow scheduler for hadoop

    Hadoop大数据平台构建、规划大数据平台集群教学课件.pptx

    在单个节点上运行NameNode、DataNode、JobTracker、TaskTracker、SeconderyNameNode 这5个进程。 完全分布模式 在多个节点上运行。 使用分布式文件系统。 在不同的节点上运行NameNode、DataNode、JobTracker、...

    搭建hadoop伪分布式.docx

    从分布式应用的角度来说,集群中的结点由一个JobTracker和若干个TaskTracker组成,JobTracker负责任务的调度,TaskTracker负责并行执行任务。TaskTracker必须运行在DataNode上,这样便于数据的本地计算。JobTracker...

    Hadoop集群架构搭建分析

    环境搭建是指在搭建 Hadoop 集群环境的过程中需要进行的步骤,包括配置 NameNode、DataNode、JobTracker、TaskTracker、HMaster、HRegionServer、SecondaryNameNode、HQuorumPeer 等组件。 配置 NameNode 需要设置 ...

    dolphinscheduler配置

    dolphinscheduler使用hive,hadoop,spark,datax,python,scala修改添加的配置

    hadoop-0.21.0-capacity-scheduler.jar

    hadoop-0.21.0-capacity-scheduler.jar

    hadoop安装与配置及mapreduce测试网站

    MapReduce 是 Hadoop 的核心组件之一,它提供了一个编程模型,用于处理大规模数据。MapReduce 的工作原理是将输入数据拆分成小块,然后对每个小块进行处理,最后将处理结果合并。MapReduce 的优点是可以处理大规模...

    hadoop0.23.9离线api

    org.apache.hadoop.lib.service.scheduler org.apache.hadoop.lib.service.security org.apache.hadoop.lib.servlet org.apache.hadoop.lib.util org.apache.hadoop.lib.wsrs org.apache.hadoop.log org....

    Hadoop实战手册

    hadoop-env.sh 环境变量13#Hadoop Common组件 配置 core-site.xml13#HDFS NameNode,DataNode组建配置 hdfs-site.xml14#配置MapReduce - JobTracker TaskTracker 启动配置15#Hadoop单机系统,启动执行和异常检查17#...

    Nutch相关框架视频教程 讲义 杨尚川

    1、 通过nutch,诞生了hadoop、tika、gora。 2、 nutch通过ivy来进行依赖管理(1.2之后)。...通过hadoop命令把apache-nutch-1.6.job提交给hadoop的JobTracker。 7、 nutch入门重点在于分析nutch脚本文件

    hadoop scheduler

    hadoop scheduler 交互流程图

    hadoop技术内幕

    《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》由Hadoop领域资深的实践者亲自执笔,首先介绍了MapReduce的设计理念和编程模型,然后从源代码的角度深入分析了RPC框架、客户端、JobTracker、TaskTracker和...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    MapReduce 的架构中,JobTracker 是作业跟踪器,负责管理所有作业处理,包括将作业分解成一系列任务,将任务指派给 TaskTracker,监控任务状态,决定哪些文件参与,然后切割 task 病分配节点。TaskTracker 是任务...

    hadoop学习手册

    作为云计算的标准开源软件,Hadoop的生态系统分布图包括多个构造模块,如NameNode、DataNode、Secondary NameNode、JobTracker和TaskTracker等。 Hadoop集群中的机器分为两类:主节点和从节点。NameNode、...

    Hadoop技术内幕 深入理解MapReduce架构设计与实现原理 扫描版 带简单书签

    《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》由Hadoop领域资深的实践者亲自执笔,首先介绍了MapReduce的设计理念和编程模型,然后从源代码的角度深入分析了RPC框架、客户端、JobTracker、TaskTracker和...

    hadoop技术内幕 深入解析mapreduce架构设计与实现原理.(董西成).全本

    《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》由Hadoop领域资深的实践者亲自执笔,首先介绍了MapReduce的设计理念和编程模型,然后从源代码的角度深入分析了RPC框架、客户端、JobTracker、TaskTracker和...

Global site tag (gtag.js) - Google Analytics