Storm事务API

javafu

浏览: 53944 次
性别:
来自: 北京

最近访客更多访客>>

zyi74

w11h22j33

vliu

siemens800

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Strom

Spout
ITransactionalSpout<T>，同BaseTransactionalSpout<T>，普通事务Spout
IPartitionedTransactionalSpout<T>，同BasePartitionedTransactionalSpout<T>，分区事务Spout
IOpaquePartitionedTransactionalSpout<T>：同BaseOpaquePartitionedTransactionalSpout<T>，不透明分区事务Spout

Bolt
IBatchBolt<T>：同BaseBatchBolt<T>，普通批处理
BaseTransactionalBolt：事务Bolt

接口Icommitter：标识IBatchBolt 或BaseTransactionalBolt是否是一个committerCoordinatedBolt

ITransactionalSpout<T>普通事务Spout
ITransactionalSpout<T>：普通事务Spout
-- ITransactionalSpout.Coordinator<X>
       --initializeTransaction(BigInteger txid, X prevMetadata) ：创建一个新的metadata，当isReady() 为true时，发射该metadata（事务tuple）到“batch emit”流
       --isReady() ：为true时启动新事务，需要时可以在此sleep

-- ITransactionalSpout.Emitter<X>
      -- emitBatch(TransactionAttempt tx, X coordinatorMeta,        BatchOutputCollector collector) ：逐个发射batch的tuple

IPartitionedTransactionalSpout<T>：分区事务Spout
IPartitionedTransactionalSpout<T>：分区事务Spout，主流事务Spout，原因是目前主流Message Queue都支持分区，分区的作用是增加MQ的吞吐量（每个分区作为一个数据源发送点），主流MQ如Kafka、RocketMQ
-- IPartitionedTransactionalSpout.Coordinator
    -- isReady() ：同上
    -- numPartitions() ：返回分区个数。当增加了数据源新分区，同时一个事务被replayed ，此时则不发射新分区的tuples，因为它知道该事务中有多少个分区。

-- IPartitionedTransactionalSpout.Emitter<X>
    --emitPartitionBatchNew(TransactionAttempt tx, BatchOutputCollector collector, int partition, X lastPartitionMeta) ：发射一个新的Batch，返回Metadata
    --emitPartitionBatch(TransactionAttempt tx, BatchOutputCollector collector, int partition, X partitionMeta) ：如果这批消息Bolt消费失败了，emitPartitionBatch负责重发这批消息

IOpaquePartitionedTransactionalSpout:不透明分区事务Spout
IOpaquePartitionedTransactionalSpout<T>：不透明分区事务Spout
--IOpaquePartitionedTransactionalSpout.Coordinator
       --isReady() ：同上 --IOpaquePartitionedTransactionalSpout.Emitter<X>
       -- emitPartitionBatch(TransactionAttempt tx, BatchOutputCollector collector, int partition, X lastPartitionMeta)
       -- numPartitions()

它不区分发新消息还是重发旧消息，全部用emitPartitionBatch搞定。虽然emitPartitionBatch返回的X应该是下一批次供自己使用的（emitPartitionBatch的第4个参数），但是只有一个批次成功以后X才会更新到ZooKeeper中，如果失败重发，emitPartitionBatch读取的X还是旧的。所以这时候自定义的X不需要记录当前批次的开始位置和下一批次的开始位置两个值，只需要记录下一批次开始位置一个值即可，例如：
public class BatchMeta {
   public long  nextOffset; //下一批次的偏移量
}

分享到：

普通事务ITransactionalSpout实例 | Storm批处理事务原理详解

2017-05-19 16:00
浏览 580
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Storm事务API

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Storm事务API

评论

发表评论

相关推荐

ITridentSpout、FirstN(取Top N)实现、 流合并和join

Trident实战之计算网站PV

Trident API和概念

Trident入门

分布式远程调用drpc实例

不透明分区事务IOpaquePartitionedTransactional实例

分区事务IPartitionedTransactionalSpout实例

普通事务ITransactionalSpout实例之按天统计数据

普通事务ITransactionalSpout实例

Storm批处理事务原理详解

集群统一启动和停止shell脚本开发

storm高并发UV统计

storm高并发PV统计，利用zookeeper锁输出汇总值

storm高并发PV统计

Storm高并发运用WordSum

storm分组策略介绍

Storm高并发介绍

Storm 字符统计Demo

Storm 本地模式

Storm启动配置

最近访客更多访客>>

ITridentSpout、FirstN(取Top N)实现、流合并和join