[Hadoop]Pig与Hive的区别

MyEyeOfJava

浏览: 1124936 次
性别:
来自: 北京

最近访客更多访客>>

yuan

jklwan

eye_n

u012363178

博主相关

博客

微博

相册

留言

关于我

博客专栏

: 测试开发
浏览量：70173

: 晨记
浏览量：0

文章分类

社区版块

存档分类

博客分类：

hadoop

请允许我很无聊的把飞机和火车拿来做比较，因为2者根本没有深入的可比性，虽然两者都是一种高速的交通工具，但是具体的作用范围是截然不同的，就像Hive和Pig都是Hadoop中的项目，并且Hive和pig有很多共同点，但Hive还似乎有点数据库的影子，而Pig基本就是一个对MapReduce实现的工具(脚本)。两者都拥有自己的表达语言，其目的是将MapReduce的实现进行简化，并且读写操作数据最终都是存储在HDFS分布式文件系统上。看起来Pig和Hive有些类似的地方，但也有些不同，来做一个简单的比较，先来看一张图：

查看大图请点击这里

再让我说几句废话：
Language
在Hive中可以执行插入/删除等操作，但是Pig中我没有发现有可以插入数据的方法，请允许我暂且认为这是最大的不同点吧。

Schemas
Hive中至少还有一个“表”的概念，但是Pig中我认为是基本没有表的概念，所谓的表建立在Pig Latin脚本中，对与Pig更不要提metadata了。

Partitions
Pig中没有表的概念，所以说到分区对于Pig来说基本免谈，如果跟Hive说“分区”(Partition)他还是能明白的。

Server
Hive可以依托于Thrift启动一个服务器，提供远程调用。找了半天压根没有发现Pig有这样的功能，如果你有新发现可以告诉我，就好像有人开发了一个Hive的REST

Shell
在Pig 你可以执行一些个 ls 、cat 这样很经典、很cool的命令，但是在使用Hive的时候我压根就没有想过有这样的需求。

Web Interface
Hive有，Pig无

JDBC/ODBC
Pig无，Hive有

分享到：

[Hadoop]chukwa的简单介绍 | [Hadoop]转载-Pig的简单介绍

2012-07-20 11:45
浏览 13247
评论(2)
分类:行业应用
查看更多

2 楼 scamer 2013-11-27

谢谢，学习了

1 楼最佳蜗牛 2013-05-02

收藏。学习。谢谢

发表评论

您还没有登录,请您登录后再发表评论