`

2、hadoop子项目

 
阅读更多

##Pig---hadoop客户端

Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

http://guoyunsky.iteye.com/blog/1317084

http://blackproof.iteye.com/blog/1791980

 

##Hbase--apache顶级项目

Hbase query language(HQL Not only sql)

google3大论文之一bigtable的开源实现;适合高速读写数据场景。

http://blog.csdn.net/viewcode/article/details/9967497

http://www.csdn.net/article/2014-02-17/2818431-HDFS+MapReduce+Hbase

 

##Hive(蜂巢)--Hbase的数据仓库项目

http://sishuok.com/forum/blogPost/list/6220.html

http://zhangwei20086.blog.163.com/blog/static/230557182012619111956724/

HiveQL支持大部分SQL

 

##zookeeper

通信协调软件,google chubby的开元实现,确认消息是否到达,防止单点失效,处理负载均衡。

http://www.blogjava.net/BucketLi/archive/2010/12/21/341268.html

http://cailin.iteye.com/blog/2014486

 

sqoop

实现hadoop与关系型数据库的交互

 

avro(avro)

数据序列化工具,用于大数据交互

 

chukwa--数据收集与分析框架

 

cassanda--facebook提供与hbase类似

 

分享到:
评论

相关推荐

    Hadoop.chm HadoopAPI Hadoop英文版最新API

    Hadoop的子项目及其后续项目所用的名称也与其本身的功能多数相关,通常以动物的名字。一些小的组件,名称通常具有很好的描述性。比如:jobtracker是用于跟踪MapReduce作业的。从零开始构建一个网络搜索引擎是一个很...

    基于hadoop子项目_Hive的云计算性能测试_沙恒.pdf

    云计算性能测试_

    ZooKeeper大型分布式系统的可靠协调系统v3.7.0_Hadoop正式子项目.zip

    ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能...

    Hadoop实战(韩冀中)中文版

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    Hadoop在互联网企业中的应用案例;集成各个子项目形成企业级数据分析平台;Hadoop与机器学习

    Hadoop在互联网企业中的应用案例;集成各个子项目形成企业级数据分析平台;Hadoop与机器学习

    尚硅谷大数据技术之Hadoop.xmind

    2003-2004年,Google公开了...2005 年Hadoop 作为 Lucene的子项目 Nutch的一部分正式引入Apache基金会。2006 年 3 月份,Map-Reduce和Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中

    Hadoop实战中文版.PDF

    23612.4 搭建面向企业查询的分析系统——IBM的ES2项目 23812.4.1 ES2系统结构 24012.4.2 ES2爬虫 24112.4.3 ES2分析 24212.4.4 小结 24912.4.5 参考文献 250附录A HDFS文件命令 251构建hadoop运算坚实...

    Hadoop实战-陆嘉恒

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    hadoop-study:hadoop学习项目

    hadoop-study 个人大数据学习项目,主要记录学习过程中所写的代码。 本项目包含以下模块: hadoop-study-kafka: kafka 学习相关代码。 hadoop-study-scala: scala 语言学习的代码,这里面的代码包含书籍<...

    hadoop 实战 中文版 韩冀中

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    Hadoop实战

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    Hadoop实战(陆嘉恒)

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    hbase-2.5.8-hadoop3-bin.tar.gz

    HBase是一个分布式的、面向列的开源数据库,该技术...HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

    elasticsearch-hadoop-5.6.7

    elasticsearch-hadoop是一个深度集成Hadoop和ElasticSearch的项目,也是ES官方来维护的一个子项目,通过实现Hadoop和ES之间的输入输出,可以在Hadoop里面对ES集群的数据进行读取和写入,充分发挥Map-Reduce并行处理...

    开源分布式数据库Hadoop PPT

    开源分布式数据库Hadoop PPT,Hadoop 使用了POSIX的设计来实现对文件系统文件流的...HDFS(Hadoop FileSystem)原来是Apache Nutch搜索引擎(从Lucene发展而来)开发的一个部分,后来独立出来作为一个Apache子项目。

    Hadoop实战丛书

    内容全面,对hadoop整个技术体系进行了全面的讲解,不仅包括hdfs和mapreduce这两大核心内容,而且还包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等与hadoop相关的子项目的内容。实战性强,为各个知识点...

    Hadoop实战(全面、权威的Hadoop实战教程)中文第一版陆嘉恒著

    内容全面,涵盖Hadoop技术本身和Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等所有与Hadoop相关的子项目! 实战性强,为各个知识点精心设计了大量经典的小案例,易于理解,可操作性强!

    《Hadoop实战》试读本(作者:陆嘉恒)

    内容全面,对Hadoop整个技术体系进行了全面的讲解,不仅包括HDFS和MapReduce这两大核心内容,而且还包括Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等与Hadoop相关的子项目的内容。实战性强,为各个知识点...

Global site tag (gtag.js) - Google Analytics