Spark源码分析2-Driver generate jobs and launch task - - ITeye博客

`

frankfan915

浏览: 350112 次
性别:
来自: 杭州

最近访客更多访客>>

gaojingsong

javacoo

449582981

nick_jian

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

无红墙：另一种修改，请参考：https://github.com/ta ...
Dubbo不能优雅停机，导致停止服务的时候，业务掉单
fish_no7： if (handler instanceof WrappedC ...
Dubbo不能优雅停机，导致停止服务的时候，业务掉单
frankfan915： lizhou828 写道怎么解决？设置NetTimeoutFo ...
Communications link failure错误分析
lizhou828：怎么解决？
Communications link failure错误分析
frankfan915： ileson 写道解决办法sh设置NetTimeoutFo ...
Communications link failure错误分析

Spark源码分析2-Driver generate jobs and launch task

博客分类：

Spark
源码分析

阅读更多

Driver generate jobs and launch task

1. Driver将按照DStream的compute方法生成RDD的依赖列表

2. 按照RDD的关系生成stage的列表，stage分为两种：finalStage和shuffledStage .

1）每个ShuffledRDD 都会产生一个shuffledStage，shuffledstage用来将shuffledRDD的prev RDD计算的结果按照patition写入到每个bucket中去，这个过程叫做shuff writer。ShuffledRDD 在computer的时候会按照patition ID 和shuff ID 去每个bucket拿数据。

2）finalStage调用每个RDD的computor函数就算结果，computor的函数参数是前一个RDD的iterator以及context，computor的返回值是经过转换过的iterator以及context。用的是装饰者模式。

3. Deriver按照每个stage生成一个taskset，然后以来SchedulableBuilder确定taskset提交的顺序，每个task依赖于RDD的getPreferredLocations来确定提交到那个Excutor

Driver will depend on the computor function of DStream to generate RDD.

bellow picture show the workflow of launch tasks

spark_anlysis.rar (193.7 KB)
下载次数: 11

查看图片附件

分享到：

Spark源码分析3-The connect between driv ... | Spark源码分析1-部署与整体架构

2014-05-06 14:34
浏览 1370
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

jeecg-mybatis-generate 源码: jeecg-mybatis-generate 源码

zapgui+-+generate+sap+r3+license+keys.rar: zapgui+-+generate+sap+r3+license+keys.rar

精品软件工具--Automatically generate model files, support JSON an.zip: 精品软件工具--Automatically generate model files, support JSON an

wsdl2java源码-wsdl-to-stub-generate:从wsdl生成存根的项目: wsdl2java源码wsdl 到存根生成从 wsdl 生成存根的项目生成客户端存根添加以下依赖项以从 wsdl 文件创建存根 org.apache.cxf cxf 核心 3.1.4 在 pom.xml 中添加以下代码以生成客户端存根 org.apache.cxf cxf-...

Matlab的卷积编码完整的系统-datagenerate.m: Matlab的卷积编码完整的系统-datagenerate.m 利用 bpsk调制高斯信道卷积码分析系统性能的完整程序

Laravel开发-laravel-admin-generate-crud: Laravel开发-laravel-admin-generate-crud Laravel管理插件。

Code-Generate-源码.rar: Code-Generate-源码.rar

zapgui - generate sap r3 license keys: SAP IDES License 通用算号器解决许可证过期问题亲测可用

Laravel开发-laravel-scaffold-generate: Laravel开发-laravel-scaffold-generate Laravel5积垢发生器

itcast-dashboard-generate.zip: itcast-dashboard-generate.zip

Virtual-Print-generate-PDF.rar_c# PostScript_c# virtual print_po: C#编写的用PostScript模拟打印成一个文件，生成一个虚拟打印机，将文件输出到该虚拟打印机就生成了一个PDF文件

neo4j-spark-connector：用于Apache Spark的Neo4j连接器，它使用Spark DataSource API提供从Spark对Neo4j的双向读写访问: 这个neo4j-connector-apache-spark是Apache 2许可的从源代码生成文档 cd doc # Install NodeJS dependencies npm install # Generate HTML/CSS from asciidoc ./node_modules/.bin/antora docs.yml # Start local ...

Laravel开发-response-generate: Laravel开发-response-generate 它将添加generate:response命令以帮助您在scaffold响应类中

java序列化源码-share-generate-sources:Java源码生成以及序列化和反序列化技术：avro|thrift|proto: css-generate-sources 源码生成通过指定格式的文本文件进行解析生成以及序列化和反序列化技术：avro|thrift|protobuf 一、avro技术 1.maven配置 <avro>1.8.2 <groupId>org.apache.avro <artifactId>avro-tools $...

sparql-generate:通过Apache Jena的SPARQL-Generate实现: SPARQL生成该项目包含基于Apache Jena的SPARQL-Generate和STTL（也称为SPARQL-Template）实现的源。

MyBatis-Generate: It will generate code for all versions of MyBatis, and versions of iBATIS after version 2.2.0. It will introspect a database table (or many tables) and will generate artifacts that can be used to ...

codegenerate-3.6.1源码: codegenerate-3.6.1.jar的源码，下载了最新jd-gui工具反编译的。jeecg框架是最新的3.7，最近做二次开发需要修改自动生成代码。做jeecg二次开发的可以相互探讨交流

DevExpress VCL v2012 vol 1.6源码-例子-帮助-part2: ==注意：一共2个压缩包，这是第2个== =============================== DevExpress VCL v2012 vol 1.6 包含所有源码、例子、帮助如果你安装过其它版本的DevExpressVCL，安装前请完全卸载老版本的Dev控件，并执行...

Global site tag (gtag.js) - Google Analytics