`
eric_weitm
  • 浏览: 235482 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

yarn 概述

 
阅读更多

yarn 概述

hdfs上面的资源管理和计算框架

 

一、角色划分

http://www.cnblogs.com/chushiyaoyue/p/5784871.html

ResourceManager rm; 总控 = 调度器 + 应用程序管理器

NodeManager nm;具体节点

ApplicationMaster am; 应用

Container是一个动态资源分配单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定每个任务使用的资源量。

 

 

二、yarn job的调度过程

1、提交,其中包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。

2、ResourceManager为该应用程序分配第一个Container,并与对应的Node-Manager通信,要求它在这个Container中启动应用程序的ApplicationMaster。

3、ApplicationMaster首先向ResourceManager注册,这样用户可以直接通过ResourceManager查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束,即重复步骤4~7。

4、ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源

5、一旦ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务。

6、NodeManager为任务设置好运行环境(包括环境变量、JAR包、二进制程序等)后,将任务启动命令写到一个脚本中,并通过运行该脚本启动任务。

7、各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,以让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务。在应用程序运行过程中,用户可随时通过RPC向ApplicationMaster查询应用程序的当前运行状态。

8、应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己。

 

三、总结

ResourceManager和NodeManager(NM)组成了基本的数据计算框架。application相当于map-reduce job或者DAG jobs。ApplicationMaster对应的是一个应用程序,也就是一个map-reduce job

和map reduce相比,是把资源管理和作业调度进行了解耦(只提供资源管理)

分享到:
评论

相关推荐

    YARN框架概述与集群部署.pdf

    YARN框架概述与集群部署.pdf

    大数据技术Hadoop3.x 2021年

    14_Hadoop_入门_YARN概述.mp4 16_Hadoop_入门_HDFS&YARN&MR关系.mp4 17_Hadoop_入门_大数据技术生态体系.mp4 18_Hadoop_入门_VMware安装.mp4 20_Hadoop_入门_IP和主机名称配置.mp4 21_Hadoop_入门_Xshell远程访问...

    storm on yarn概念架构消息机制概述

    storm on yarn概念架构消息机制概述 包括storm job跟mapreduce job对比 storm on yarn架构图 storm关键概念描述 storm消息机制介绍

    java连接sqoop源码-LearningHadoop2:学习Hadoop2

    HDFS和YARN概述 分布式计算 问题:大数据使计算资源(CPU、存储)紧张 解决方案:将负载分配到多台服务器而不是一台 雅虎! 使用分布式计算模型开发Hadoop Hadoop分布式文件系统(HDFS) Hadoop 文件系统 跨越集群中的...

    23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化

    23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化 ...本文介绍在hadoop集群中,不适用默认的参数情况下,yarn的cpu和内容配置。 本文依赖是hadoop集群正常...本文分为3个部分,即概述、cpu和内存配置。

    HadoopYARN大数据计算框架及其资源调度机制研究

    HadoopYARN大数据计算框架及其资源调度机制研究,对Yarn的工作机制做一个全面的概述,揭示原理

    presentation-yarn-workspaces-and-lerna-vs-nx

    文献资料 介绍Lerna和Nx的纱线工作区之间的差异。 呈现 该演示文稿是使用。 要通过按“ f”键进入全屏模式。...yarn && yarn dev 部署中 该演示文稿已部署在,因此只需将更改推送到github,它将自动部署。

    HCIA-Big Data V2.0视频.zip

    3.1 MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.1 MapReduce和Yar.zip 3.2 YARN的功能与架构 3.3 YARN的资源管理和特性介绍 4.1 Spark概述及核心Spark Core 4.2 Spark体系结构梳理 5.1 Hbase的功能和...

    华为HCIA-Big Data V2.0 LVC公开课培训视频教程【共25集】.rar

    3.1.1 MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2.1 YARN的功能与架构 3.3.1 YARN的资源管理和特性介绍 4.1.1 Spark概述及核心Spark Core# 4.2.1 Spark体系结构梳理 5.1.1 Hbase的功能和架构 ...

    Spark概述与环境搭建(yarn|Standlone)

    概述 Spark是一个快如闪电的统一分析引擎(计算框架)用于大规模数据集的处理。Spark在做数据的批处理计算,计算性能大约是Hadoop MapReduce的10~100倍,因为Spark使用比较先进的基于 DAG 任务调度,可以将一个任务...

    大数据培训视频.zip

    3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2_Yarn的资源管理和任务调度-增强特性 4.1_Spark概述-Spark原理与架构 4.2_Spark原理与架构-Spark在FusionInsight中的集成情况 5.1_HBase基本介绍 5.2_...

    TensorFlow on YARN (TonY) - 在Apache Hadoop上原生运行TensorFlow的框架-python

    TensorFlow on YARN (TonY) - 在Apache Hadoop上原生运行TensorFlow的框架TonY TonY 是一个在 Apache Hadoop 上本地运行深度学习作业的框架。 它目前支持 TensorFlow、PyTorch、MXNet 和 Horovod。 TonY 支持将单...

    华为HCIA-Big Data V2.0 LVC公开课培训.rar

    3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2_Yarn的资源管理和任务调度-增强特性 第四章 Spark2x基于内存的分布式计算 4.1_Spark概述-Spark原理与架构 4.2_Spark原理与架构-Spark在FusionInsight...

    create-eth-app:使用一个命令创建以太坊驱动的应用

    快速概述 yarn create eth-app my-eth-app cd my-eth-app yarn react-app:start 如果您先前已通过yarn global add create-eth-app create-eth-app全局安装了create-eth-app ,我们建议您使用yarn global remove ...

    2_尚硅谷大数据之从Hadoop框架讨论大数据生态1

    2.3 Hadoop 三大发行版本 2.5.1 HDFS 架构概述 2.5.2 YARN 架构概述 2.6 大数据技术生态体系

    大数据技术概述.pdf

    ⼤数据技术概述 ⼤数据的概念 4V:⼤量化volume、价值密度低value、快速化velocity、多样化variety。⼤量化每两年增长⼀倍,到了2020年,全球就会有35ZB数据 量,Byte->KB->MB->GB->TB->PB->EB->ZB。多样化,结构化...

    tronscan-frontend:Tronscan前端

    节点概述 基本信息浏览器 快速搜索令牌 网络钱包 Poloni DEX DApp推荐 投票给SR TRON委员会 代币列表 合同部署与验证 DApp链 节点测试仪 交易调试器 要求 node.js 纱 跑步 > yarn install > yarn start 配置API ...

    大数据基础-数据可视化技术.pdf

    在Hadoop生态群中,核心部 件(如HDFS、Yarn和HBase等)都提供可视化的集群管理功能,便于用户直观、 快速地了解集群的运行状态;第6章Kylin、Superset及第8章的Zeppelin等OLAP 工具的重要任务是为用户提供在线可视...

    knit:不推荐使用,请使用https

    概述knit ,您可以将python与YARN(Hadoop系统最常见的资源管理器)结合使用。 它提供了以下高级入口点: CondaCreator ,一种创建压缩conda环境的方法,因此可以将其上传到HDFS并提取出来以在YARN容器中使用YARNAPI...

    whats-new-in-emberland:关于Ember核心和社区存储库的本周更新和更改的概述页面

    这是与Ember相关的Github活动的概述应用程序,调查人员在来查找新闻通讯的新主题。 先决条件 您需要在计算机上正确安装以下物品。 (使用npm) 安装 该项目使用yarn来管理npm软件包。 要检查是否已经安装了yarn ,...

Global site tag (gtag.js) - Google Analytics