hive having count 不能去重 - duncan--学无止境 - ITeye博客

`

daizj

浏览: 771054 次
性别:
来自: 广州

最近访客更多访客>>

guwq2014

snowolf

junes_yu

yuanyuan7891

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hive having count 不能去重

博客分类：

hive

hive having count 去重计数

阅读更多

hive在使用having count()是，不支持去重计数

hive (default)> select username from t_test_phonenum where ds=20150701 group by username having count(distinct sex)>1 limit 10;

FAILED: SemanticException [Error 10002]: Line 1:95 Invalid column reference 'sex'

hive (default)> select username from t_test_phonenum where ds=20150701 group by username having count(sex)>1 limit 10;

Total MapReduce jobs = 1

Launching Job 1 out of 1

Number of reduce tasks not specified. Estimated from input data size: 1

In order to change the average load for a reducer (in bytes):

set hive.exec.reducers.bytes.per.reducer=<number>

In order to limit the maximum number of reducers:

set hive.exec.reducers.max=<number>

In order to set a constant number of reducers:

set mapred.reduce.tasks=<number>

Starting Job = job_201503201830_2570778, Tracking URL = http://10-198-131-242:8080/jobdetails.jsp?jobid=job_201503201830_2570778

Kill Command = /data/home/hadoop-1.2.1/libexec/../bin/hadoop job -kill job_201503201830_2570778

Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1

2015-07-03 11:07:16,954 Stage-1 map = 0%, reduce = 0%

2015-07-03 11:07:33,530 Stage-1 map = 100%, reduce = 0%

2015-07-03 11:07:47,620 Stage-1 map = 100%, reduce = 33%, Cumulative CPU 14.32 sec

2015-07-03 11:07:55,742 Stage-1 map = 100%, reduce = 100%, Cumulative CPU 20.78 sec

MapReduce Total cumulative CPU time: 20 seconds 780 msec

Ended Job = job_201503201830_2570778

MapReduce Jobs Launched:

Job 0: Map: 1 Reduce: 1 Cumulative CPU: 20.78 sec HDFS Read: 17371199 HDFS Write: 98 SUCCESS

Total MapReduce CPU Time Spent: 20 seconds 780 msec

OK

02541213XXXXX

特此记录一下

0
顶

0
踩

分享到：

SecureCRT快捷键 | Shell 流程控制

2015-07-03 11:10
浏览 7516
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

presto和hive的使用区别: Hive是把一个查询转化成多个MapReduce任务，然后一个接一个执行。执行的中间结果通过对磁盘的读写来同步。然而，Presto没有使用MapReduce，它是通过一个定制的查询和执行引擎来完成的。它的所有的查询处理是在内存中...

hive: hive hive hive hive hive hive hive hive hive hive hive hive

Hive3.1.2编译源码: 使用hive3.1.2和spark3.0.0配置hive on spark的时候，发现官方下载的hive3.1.2和spark3.0.0不兼容，hive3.1.2对应的版本是spark2.3.0，而spark3.0.0对应的hadoop版本是hadoop2.6或hadoop2.7。所以，如果想要使用高...

Hive JDBC连接: hive2.3.2 JDBC连接，sql developer可用。选择第三方jdbc，加入，就可以显示hive连接。用的cloudra的jdbc用于连接操作数据库，java开发请使用maven获取开源组件。

hive-3.1.1安装包: 它不仅可以存储大量的数据而且可以对存储的数据进行分析，但它有个缺点就是不能实时的更新数据，无法直接修改和删除数据，如果想要修改数据需要先把数据所在的文件下载下来，修改完之后再上传上去。 Hive也不是...

hive开启权限后不能创建数据库问题: 背景：由于Hive需要开启权限管理，安装网上教程，开启权限配置，重启集群后。使用root用户登录，进入Hive命令行界面。执行 create database test; 发现报错： Authorization failed:No privilege 'Create' found ...

Spark不能使用hive自定义函数.doc: Spark不能使用hive自定义函数

Hive新手学习资料之Hive入门与实战.+Hive用户手册+hive函数大全中文版资源合集: hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低，可以通过类似SQL语句实现快速MapReduce统计，使MapReduce变得更加...

hive-jdbc hive jdbc驱动: hive-jdbc

Hive表生成工具，Hive表生成工具Hive表生成工具: Hive表生成工具，Hive表生成工具Hive表生成工具

Hive使用手册Hive使用手册: 1 Hive 概念与连接使用: 2 2 Hive支持的数据类型： 2 2.1原子数据类型： 2 2.2复杂数据类型： 2 2.3 Hive类型转换： 3 3 Hive创建/删除数据库 3 3.1创建数据库: 3 3.2 删除数据库: 3 4 Hive 表相关语句 3 4.1 Hive ...

《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf: 《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第...

分布式数据仓库Hive大全: 8.3 count(distinct) 43 8.4 JOIN 43 8.5 DML操作 44 8.6 HAVING 44 8.7 子查询 44 8.8 Join中处理null值的语义区别 44 9. 优化与技巧 47 9.1 全排序 47 9.1.1 例1 48 9.1.2 例2 51 9.2 怎样做笛卡尔积 54 9.3 怎样...

Hive用户指南: 8.3 count(distinct) 43 8.4 JOIN 43 8.5 DML操作 44 8.6 HAVING 44 8.7 子查询 44 8.8 Join中处理null值的语义区别 44 9. 优化与技巧 47 9.1 全排序 47 9.1.1 例1 48 9.1.2 例2 51 9.2 怎样做笛卡尔积 54 9.3 怎样...

HIVE优化实战分享: HIVE优化实战分享 HIVE优化实战分享 HIVE优化实战分享

Hive.sql，hive的元数据: Hive.sql

hivesql语句练习: 6. Jline包版本不一致的问题，需要拷贝hive的lib目录中jline.2.12.jar的jar包替换掉hadoop中的 /home/hadoop/app/hadoop-2.6.4/share/hadoop/yarn/lib/jline-0.9.94.jar 启动hive bin/hive ---------------------...

Ambari下Hive3.0升级到Hive4.0: Ambari下Hive3.0升级到Hive4.0，验证自测；

Hive总结.docx: Hive原理/Hive SQL/Hive 函数/数据仓库分层和建模/Hive sql优化/数据倾斜

Global site tag (gtag.js) - Google Analytics