`

Trident入门

 
阅读更多
英文原址:https://github.com/nathanmarz/storm/wiki/Trident-tutorial

翻译地址1:http://blog.csdn.net/derekjiang/article/details/9126185#t3

翻译地址2:http://www.tuicool.com/articles/B3yA3aI

Trident是完全容错的,拥有有且只有一次处理的语义,其实就是transactional的高级封装。这就让你可以很轻松的使用Trident来进行实时数据处理。Trident会把状态以某种形式保持起来,当有错误发生时,它会根据需要来恢复这些状态。
它在提供处理大吞吐量数据能力的同时,也提供了低延时分布式查询和有状态流式处理的能力。如果你对Pig和Cascading这种高级批量处理工具很了解的话,那么应该毕竟容易理解Trident,因为他们之间很多的概念和思想都是类似的。Tident提供了 joins, aggregations, grouping, functions, 以及 filters等能力。
除此之外,Trident 还提供了一些专门的原语,从而在基于数据库或者其他存储的前提下来应付有状态的递增式处理。




分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics