Borg(来自Google),YARN(来自Apache,属于Hadoop下面的一个分支,开源),Mesos(来自Twitter,开源),Torca(来自腾讯搜搜),Corona(来自Facebook,开源)一类系统被称为资源统一管理系统或者资源统一调度系统,它们是大数据时代的必然产物。概括起来,这类系统设计动机是解决以下两类问题:
(1) 提高集群资源利用率
在大数据时代,为了存储和处理海量数据,需要规模较大的服务器集群或者数据中心,一般说来,这些集群上运行着数量众多类型纷杂的应用程序和服务,比如离线作业,流式作业,迭代式作业,crawler server,web server等,传统的做法是,每种类型的作业或者服务对应一个单独的集群,以避免相互干扰。这样,集群被分割成数量众多的小集群,有的集群运行Hadoop,有的运行Storm,有的运行Spark,有的运行web server,然而,由于不同类型的作业/服务需要的资源量不同,因此,这些小集群的利用率通常很不均衡,有的集群满负荷、资源紧张,而另外一些则长时间闲置、资源利用率极低,为了提高资源整体利用率,一种解决方案是将这些小集群合并成一个大集群,让它们共享这个大集群的资源,并由一个资源统一调度系统进行资源管理和分配,这就诞生了Borg,YARN,Mesos,Torca,Corona。从集群共享角度看,这类系统实际上将公司的所有硬件资源抽象成一个台大型计算机,供所有用户使用。
(2) 服务自动化部署
一旦将所有计算资源抽象成一个“大型计算机”后,就会产生一个问题:公司的各种服务如何进行部署?同样,Borg/YARN/Mesos/Torca/Corona一类系统需要具备服务自动化部署的功能,因此,从服务部署的角度看,这类系统实际上是服务统一管理系统,这类系统提供服务资源申请,服务自动化部署,服务容错等动能。
以上只是简单的介绍了这一类系统的设计动机和产生背景,接下来从两个角度解析这类系统。
角度一:数据中心编程
任何一个公司内部所有的硬件资源均可看做一个数据中心,通过Borg/YARN/Mesos/Torca/Corona一类系统对这些资源进行统一管理后,用户所有的程序和服务将通过一个统一入口进入数据中心,并由这类系统为之分配资源、监控程序和服务运行状态,并在失败时启用必要的容错机制,汇报程序的执行进度等,而至于应用程序或者服务运行在具体哪台机器上,所在机器的ip、端口号是什么,则用户无需管理,全部交由统一管理系统进行管理(用户也许可以查询到)。
具体说来,采用此类系统之后,当用户执行应用程序或者部署服务时,只需通过一个配置文件描述应用程序或服务需要的资源(比如CPU、内存、磁盘、操作系统类型等)、待执行的命令、依赖的外部文件等信息,然后通过一个客户端提交到Borg/YARN/Mesos/Torca/Corona上,剩下的工作则完全交给系统。
角度二:生态系统
从另外一个角度看,Borg/YARN/Mesos/Torca/Corona一类系统可以为公司构建一个内部的生态系统,所有应用程序和服务可以“和平而友好”地运行在该生态系统上。有了这类系统之后,你不必忧愁使用Hadoop的哪个版本,是Hadoop 0.20.2还是 Hadoop 1.0,你也不必为选择何种计算模型而苦恼,因此各种软件版本,各种计算模型可以一起运行在一台“超级计算机”上了。
从开源角度看,YARN的提出,从一定程度上弱化了多计算框架的优劣之争。YARN是在Hadoop MapReduce基础上演化而来的,在MapReduce时代,很多人批评MapReduce不适合迭代计算和流失计算,于是出现了Spark和Storm等计算框架,而这些系统的开发者则在自己的网站上或者论文里与MapReduce对比,鼓吹自己的系统多么先进高效,而出现了YARN之后,则形势变得明朗:MapReduce只是运行在YARN之上的一类应用程序抽象,Spark和Storm本质上也是,他们只是针对不同类型的应用开发的,没有优劣之别,各有所长,合并共处,而且,今后所有计算框架的开发,不出意外的话,也应是在YARN之上。这样,一个以YARN为底层资源管理平台,多种计算框架运行于其上的生态系统诞生了。
这一篇和上一篇《多集群下资源共享方案介绍》内容有些重复,我一直在反反复复强调资源管理/调度系统,目的只有一个,我想告诉大家:YARN时代来了!(所有的软件和服务都在往YARN上移,包括MapReduce,Spark,Storm,MPI,HBase部署等…..)
参考资料:
Borg:http://www.quora.com/What-is-Borg-at-Google
YARN:http://dongxicheng.org/mapreduce-nextgen/nextgen-mapreduce-introduction/
Mesos:http://www.mesosproject.org/
Torca:http://djt.qq.com/thread-29998-1-2.html
Mesos与YARN比较:http://dongxicheng.org/mapreduce-nextgen/mesos_vs_yarn/
Corona:http://dongxicheng.org/hadoop-corona/hadoop-corona/
原创文章,转载请注明: 转载自董的博客
本文链接地址: http://dongxicheng.org/mapreduce-nextgen/borg-yarn-mesos-torca-corona/
http://m635674608.iteye.com/admin/blogs/new
相关推荐
其他如Apache Mesos、Borg、Torca和Corona等系统,为大数据环境提供了资源的有效管理和调度。 9. 扩展和生态系统:随着技术的发展,Hadoop生态系统不断扩展,包括HBase(分布式NoSQL数据库)、Pig(数据分析平台)...
为了解决Hadoop在实时处理上的局限,出现了资源统一管理和调度系统,如Apache Mesos、YARN(Yet Another Resource Negotiator)、Google Borg、腾讯搜搜的Torca和Facebook的Corona。这些系统旨在优化资源利用率,...
为了解决Hadoop的批处理问题,出现了各种资源管理和调度系统,如Apache Mesos、YARN(Yet Another Resource Negotiator)、Google的Borg、腾讯搜搜的Torca和Facebook的Corona等。这些系统致力于提高资源利用率,...
Single chip high-speed serial link communications for multi-channel and multi-standard applications
职称计算机考试基础知识章节试题及答案汇总.doc
计算机二级excel中常考公式及讲解.docx
软件实施团队绩效考核程序.docx
电大数据库基础与应用试题.doc
内容概要:本文介绍了基于90nm CMOS工艺设计的全模拟5Gb/s时钟与数据恢复(CDR)电路。CDR电路用于从传输的数据流中恢复时钟并重新定时数据。该设计采用相位插值技术调整本地生成的5GHz时钟的相位以对齐5Gb/s输入数据流的相位。系统由二元相位检测器、电荷泵、环路滤波器、电压-电流转换器、相位插值控制器和相位插值器组成。通过调整本地时钟的相位而非频率,所有接收通道可以共享单个PLL,从而减少面积和功耗。此外,模拟相位插值控制器提供更高的相位调整分辨率和操作速度,且不需要进一步反序列化数据。设计还展示了各模块的具体电路图、布局和仿真结果。 适合人群:具备一定电子工程背景,特别是对高速通信电路设计有兴趣的研究人员和技术人员。 使用场景及目标:①适用于高速通信系统中时钟和数据恢复的设计与优化;②帮助工程师理解相位插值、模拟电路设计及其在高速数据传输中的应用;③为从事高速收发器设计的研究人员提供参考案例和技术细节。 其他说明:此资源详细展示了每个模块的工作原理及具体实现方式,包括相位检测器、相位插值控制器、比较器等关键组件的电路图和布局。同时提供了详细的仿真结果和芯片布局信息,有助于深入理解全模拟CDR电路的设计与性能评估。
算法分析与设计作业及参考答案.doc
软件公司企业系统调研报告.doc
使用Adam和LBFGS优化器基于PINN求解一维热传导方程论文复现-20250514.ipynb
管桩信息化配桩施工技术.doc
数据集介绍 SCUT-HEAD是一个大规模的头部检测数据集,人头检测计数本数据集包含A和B两部分,我将AB两部分合并在了一起,并遵循Pascal VOC标准。 数据描述 数据集包括4405张标有111251个头部的图像。该数据集由两部分组成。A部分包括从某大学教室的监控视频中抽出的2000张图像,其中有67321个头像的注释。B部分包括从互联网上抓取的2405张图片,有43930个头像被标注。我们用xmin、ymin、xmax和ymax坐标标记了每个可见的头像,并确保注释覆盖整个头像,包括被遮挡的部分,但没有额外的背景。PartA和PartB都被分为训练和测试部分。我们的数据集遵循Pascal VOC的标准。
计算机操作系统中央广播电视大学度第一学期开放专科期末考试.doc
网上书店可行性研究实验报告软件工程实验.doc
机械设备公司网站建设方案.doc
网站运营策划方案汽车团购网站运营策划方案.doc
计算机等级考试三级网络技术笔试试题.doc
湖南省计算机水平考试二级C语l言培训OFFICE操作题.doc