`
dayutianfei
  • 浏览: 5577 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Kudu简介

阅读更多

今天浏览Cloudera的官博,发现了一篇介绍《Kudu: New Apache Hadoop Storage for Fast Analytics on Fast Data》的文章,摘记如下:

 

1. 什么是Kudu

This new open source complement to HDFS and Apache HBase is designed to fill gaps in Hadoop’s storage layer that have given rise to stitched-together, hybrid architectures.

可以看出这个新组件有两个特点:1)开源(免费,ASL 2.0);2)这是一个融合HDFS和HBase的功能的新组件,具备介于两者之间的新存储组件

 

2. Kudu的使用场景

  • Strong performance for both scan and random access to help customers simplify complex hybrid architectures(适用于那些既有随机访问,也有批量数据扫描的复合场景)
  • High CPU efficiency in order to maximize the return on investment that our customers are making in modern processors(高计算量的场景)
  • High IO efficiency in order to leverage modern persistent storage(使用了高性能的存储设备,包括使用更多的内存)
  • The ability to update data in place, to avoid extraneous processing and data movement(支持数据更新,避免数据反复迁移)
  • The ability to support active-active replicated clusters that span multiple data centers in geographically distant locations(支持跨地域的实时数据备份和查询)

总结上述内容,可以归纳为两个亮点:1)将不同组件结合起来的异构生态圈打通,使得数据、操作在一个圈内进行;2)将CPU、磁盘IO统一考量,便于资源的最优分配,尤其是未来CPU的计算资源成为瓶颈后;

 

3. 总结

kudu目前来看,是把analytics 和 online两个应用场景进行了整合,目的在于将分散的大数据生态圈组件进行融合,估计这也是未来大数据生态圈急需解决的一个问题,也是一个趋势。

 

4. 关注点

如何和impala进行结合,如何与HDFS、HBase区分(包括整合、数据迁移等),如何使用SQL引擎进行检索,接口除Java、C++外是否有其他拓展的余地,性能比对

分享到:
评论
1 楼 明兜3号 2019-06-26  
Kudu分布式存储引擎
网盘地址: https://pan.baidu.com/s/1e07X_5JVnzRm4SLMugNwhw 提取码: u2pn
备用地址(腾讯微云):https://share.weiyun.com/5wz7nT6 密码:358yi2

相关推荐

    kudu简介ppt

    kudu简介,用于宣讲。 Apache Kudu是Apache Hadoop生态系统的一个免费开源的面向列的数据存储。它与Hadoop环境中的大多数数据处理框架兼容。它提供了完整的Hadoop存储层,可以快速分析快速数据。 构建Apache Kudu的...

    kudu-client驱动

    java连接kudu所需要的驱动jar包 kudu-client-1.6.0.jar

    kudu安装包.zip

    kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,kudu安装,外网下载的,

    利用Impala+Kudu构建准实时分析应用

    Kudu是Cloudera开源的新型列式存储系统,Apache Hadoop生态圈的顶级项目之一,解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark...

    由浅入深掌握大数据列式存储NoSQL数据库Kudu视频教程

    课程简介 从零开始讲解大数据列式存储NoSQL数据库Kudu,基于Kudu构建高性能随机读写访问的数据存储系统,原理从入门到深入,搞定面试 课程亮点 1,知识体系完备,从小白到大神各阶段读者均能学有所获。 2,生动形象...

    flink写入带kerberos认证的kudu connector

    flink写入带kerberos认证的kudu connector

    kudu1.4的rpm安装包

    kudu的rpm安装包,包含以下六个资源: kudu-1.4.0+cdh5.12.2+0-1.cdh5.12.2.p0.8.el7.x86_64.rpm kudu-client0-1.4.0+cdh5.12.2+0-1.cdh5.12.2.p0.8.el7.x86_64.rpm kudu-client-devel-1.4.0+cdh5.12.2+0-1.cdh...

    kudu安装包

    kudu 安装包 分享给需要的人,kudu 分布式内存数据库。

    Apache Kudu用户指导手册.pdf

    Apache Kudu 用户指导手册英文原版: 1、About Apache Kudu 2、Apache Kudu Release Notes 3、Installing and Upgrading Apache Kudu 4、Using Apache Impala (incubating) with Kudu 5、Developing With Apache ...

    flink1.14.0 kudu1.10.0 connector

    按照我自己的环境将flink升级到1.14.0也就是目前最新的版本,kudu降到1.10.0。 由于flink api的改动,所以修改了一丢丢源码,同时最后编译打包时跳过了deprecation警告,得到目前的包。 【环境:cdh6.3.2(kudu...

    大数据-数据迁移-hive、hbase、kudu迁移

    由于大数据里面涉及到非关系型数据库如hive、kudu、hbase等的数据迁移,目前涉及到的迁移工具都没有支持hive数据库的事务表的迁移,如果hive库里面存在大量的事务表的时候,目前的工具都是不支持的,例如华为的CDM,...

    kudu, Apache Kudu 从https镜像.zip

    kudu, Apache Kudu 从https镜像 Kudu开发人员文档构建和安装 Kudu按照文档中的步骤从源代码构建和安装 Kudu从树中生成 Kudu单个Kudu源树可以用于多个构建,每个生成都有自己的构建目录。 生成目录可以以放置在 文件...

    kudu1.6RPM安装包.rar

    kudu离线RPM安装包,包括kudu-tserver-1.6.0、kudu-master-1.6.0、kudu-debuginfo-1.6.0、kudu-client-devel-1.6.0、kudu-client0-1.6.0、kudu-1.6.0

    kudu1.15.zip

    kudu1.15编译升级包(注意:不是安装包,是升级包,要求kudu集群已经安装好,需要升级到1.15的话可以使用此包平滑升级)

    kudu cm安装方式文档

    关于cdh 出版的kudu安装步骤,包含了一些介绍,以及kudu安装截图

    KUDU介绍及实践

    2017第八届数据库技术大会DTCC,小米张震介绍KUDU及实践

    kudu java 客户端demo

    kudu的java 客户端完整实例代码,使用java连接kudu进行基础操作

    kudu1.2操作文档

    kudu操作文档,很全,包括架构,安装,对表的操作等等很多

    kudu-1.7.0+cdh5.15.1 .zip

    kudu-1.7.0+cdh5.15.1 等6个文件;kudu-1.7.0+cdh5.15.1 等6个文件 kudu-1.7.0+cdh5.15.1 等6个文件;kudu-1.7.0+cdh5.15.1 等6个文件 大数据;存储;Kudu;Spark;cdh5.15.1

    kudu_1.13.tgz

    压缩文件包含 :kudu执行文件、kudu-master、kudu-tserver,直接在原来的旧集群,替换这三个文件就可以升级使用。

Global site tag (gtag.js) - Google Analytics