LocalJobRunner

evans_he

浏览: 12335 次
性别:
来自: 深圳

最近访客更多访客>>

new_restart

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

hadoop MapReduce LocalJobRunner

hadoop作业分本地模式和分布式模式两种执行模式，JobClient初始化时会读取配置项mapred.job.tracker(默认为local)，如果该配置项的值为local，则hadoop采本地模式执行作业，否则采用分布式模式执行。本地模式使用LocalJobRuner提交并执行作业。对LocalJobRunner实例调用submitJob( )方法会创建Job(LocalJobRunner的内部类)实例，该实例完成作业的执行。
从图中可以看到，LocalJobRunner的内部类Job就是一个线程，其实本地模式的MapReduce作业就由该线程完成。Job的内部类MapTaskRunnable实现了Runnable接口，代表了Map任务，每个分片都对应一个MapTaskRunnable实例，Job采用java并发包提供的ExecutorService线程池来执行MapTaskRunnable实例，线程池的大小为分片数量和mapreduce.local.map.tasks.maximum配置项值中较小者，至少为1。线程池创建好之后就将MapTaskRunnable实例都提交到其中去执行，然后线程池停止接受新任务等待线程执行完毕。线程执行完毕后会逐个检查MapTaskRunnable实例有没有异常出现，如果有则认为map执行失败，直接抛出异常终止执行，如果都没有异常则认为map都执行成功，接下来继续执行reduce。本地模式值允许0个或者1个reduce任务。ReduceTask代表一个reduce任务，它从map的输出文件中读取数据进行reduce操作，将结果写到指定的目录中。reduce任务执行完之后，会进行一些清理操作，删除map的中间输出，删除作业提交目录和其中的作业配置文件、删除作业的本地拷贝文件等。

本地执行模式：

源代码就不再贴了，请参考LocalJobRunner。

查看图片附件

0
顶

0
踩

分享到：

MapReduce读取数据

2014-07-08 00:01
浏览 3197
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop硬实战 [（美）霍姆斯著][电子工业出版社][2015.01]_PDF电子书下载带书签目录高清完整版.rar ): 技术点80　用LocalJobRunner 进行重量级的作业测试 13．1．4　集成和QA 测试 13．2　调试用户空间的问题 13．2．1　访问任务日志技术点81　检查任务日志 13．2．2　调试不可预期的输入技术点82　定位input split ...

Hadopp集群运用过程中碰到的问题: - **错误现象3：WARN mapred.LocalJobRunner: job_local_0001 java.lang.OutOfMemoryError: Java heap space** - 原因：Eclipse中的MapReduce任务内存不足。 - 解决方法：调整Eclipse或JVM的内存设置，确保有足够...

mapreduce运行过程(个人见解如有错误希望大神指导).pdf: 如果是本地运行的MapReduce模拟器，代理对象为LocalJobRunner。 2. JobSubmitter通过代理对象向ResourceManager申请提交一个application，ResourceManager会返回资源提交路径stagingDir和jobID，并将它们拼接成job...

江西师范大学科学技术学院在四川2020-2024各专业最低录取分数及位次表.pdf: 那些年，与你同分同位次的同学都去了哪里？全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据，高考志愿必备参考数据

麒麟win10双系统重新安装win10后麒麟启动菜单看不到解决方法: 麒麟win10双系统重新安装win10后麒麟启动菜单看不到解决方法

多邻国Duolingo v6.0.3 高级版.apk: 多邻国Duolingo v6.0.3 高级版.apk

QT网络编程: 实现TCP通讯设置（客户端）: QT网络编程: 实现TCP通讯设置（客户端）

前后端全部开源微信小程序商城（Java + uniapp）快速搭建一个属于自己的微信小程序商城: 减少重复造轮子，开源微信小程序商城（前后端开源：uniapp+Java）。快速搭建一个属于自己的微信小程序商城。

个人发卡彩虹云商城最新彩虹代刷V6.9.0免授权纯净完整版: 彩虹云商城最新彩虹代刷V6.9.0免授权纯净完整版直接上传源码解压缩后访问域名安装即可，亲测可用彩虹自助下单系统安装说明：上传到空间后直接访问即可根据提示安装。 PHP推荐使用7.0及以上版本 V6.9 1.修复SQL注入漏洞 2.修复后台微信QQ扫码登录 V6.8.5 1.修复亿乐对接 2.新增支持倍数输入框 V6.8 1.更新全新的faka模板 2.新增微信快捷登录 3.新增批量下单功能 4.防CC配置新增滑动验证码模式 5.修复部分地区后台加载错误 6.修复https网站对接http支付接口 7.后台登录支持微信QQ扫码登录

上海立信会计金融学院在四川2020-2024各专业最低录取分数及位次表.pdf: 那些年，与你同分同位次的同学都去了哪里？全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据，高考志愿必备参考数据

广州软件学院在四川2020-2024各专业最低录取分数及位次表.pdf: 那些年，与你同分同位次的同学都去了哪里？全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据，高考志愿必备参考数据

基于MATLAB贪吃蛇系统GUI面板.zip: 网鼎杯

网络安全入门教程（工具版）: 网络安全入门教程（工具版）

科普里控制器调试软件工具使用: 科普里控制器调试软件工具使用 win64环境安装

a-Si TFT LCD驱动芯片GC9503V的技术参数与接口详解: 内容概要：本文档详细介绍了GC9503V单片机a-Si TFT LCD驱动器的技术规格，包括主要特点、内部结构图、引脚定义以及系统接口等。GC9503V支持480x864分辨率，16.7百万色显示，无内置GRAM。文章还提供了详细的引脚尺寸、对齐标记尺寸、芯片信息以及接口模式控制的序列实例，如DCS写入命令及其参数。适合人群：LCD显示屏设计人员、嵌入式系统工程师、电子硬件开发者和技术研究人员。使用场景及目标：帮助开发者快速理解和应用GC9503V在实际产品中的具体使用方法，掌握LCM与MCU之间的数据交互方式，实现高效的屏幕驱动设计。其他说明：GalaxyCore公司保留在不事先通知的情况下更改文档内容的权利。

岭南师范学院在四川2020-2024各专业最低录取分数及位次表.pdf: 那些年，与你同分同位次的同学都去了哪里？全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据，高考志愿必备参考数据

yolo算法-跌倒检测数据集-2307张图像带标签-_人_工作_fall-detection-ngtxo.zip: yolo系列算法目标检测数据集，包含标签，可以直接训练模型和验证测试，数据集已经划分好，适用yolov5,yolov8,yolov9,yolov7,yolov10,yolo11算法；包含两种标签格:yolo格式（txt文件）和voc格式（xml文件），分别保存在两个文件夹中; yolo格式：<class> <x_center> <y_center> <width> <height>，其中： <class> 是目标的类别索引（从0开始）。 <x_center> 和 <y_center> 是目标框中心点的x和y坐标，这些坐标是相对于图像宽度和高度的比例值，范围在0到1之间。 <width> 和 <height> 是目标框的宽度和高度，也是相对于图像宽度和高度的比例值

最近访客 更多访客>>