`

Hive CLI

 
阅读更多

 

1、创内部建表,hive把数据移动到仓库目录,hive管理数据,所以drop表时会把元数据和数据一起删除

create table user (id int, name string) row format delimited fields terminated by '\t'

2、将本地文件系统上的数据导入到表中

load data local inpath '/root/user.txt' into table user;
#删除表对应目录已有的数据
load data local inpath '/root/user.txt' overwite into table user

3、hive cli中运行hdfs 命令

dfs -ls /;
dfs -mkdir /data;
4、创建外部表,外部数据的位置需要在创建表时指定,数据不由hive管理,不会把数据移动到自己的仓库目录,drop外部表时hive只会删除元数据而不会删除数据
create external table stubak (id int, name string) row format delimited fields terminated by '\t' location '/stubak';
5、创建分区表,按照nation分区,分区就是创建子文件夹,user/nation=China/user.txt
#创建分区表
create table user(id int, name string) partitioned by (nation string) row format delimited fields terminated by '\t';
#加载分区表数据
load data local inpath './user.txt' inset into table user partition (nation='China')
load data local inpath './user.txt' overwrite into table user partition (nation='China')
#查看分区
show partitions table;
 6、自定义函数
#将jar包添加classpath
add jar /root/NUDF.jar;
#创建临时函数getNation 
create temporary function getNation as 'hive.udf.NationUDF';
#调用
select id, name, getNation(nation) from beauty;
#将查询结果保存到HDFS
create table result row format delimited fields terminated by '\t' as select * from beauty order by id desc;
create table result row format delimited fields terminated by '\t' as select id, getNation(nation) from beauties;
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    hive-cli-1.1.0.jar

    大数据hadoop中hive-1.1.0 的cli ,jar包,hive-cli-1.1.0.jar

    HiveCLI和Beeline命令行的基本使用.md

    HiveCLI和Beeline命令行的基本使用,基础篇

    hive jar 包

    hive-cli.jar hive-common.jar hive-contrib.jar hive-hbaseec.jar hive-hbase-handler.jar hive-hwi.jar hive-jdbc.jar hive-metastorejar hive-serde.jar hive-service.jar hive-shims.jar hadoop-core-1.0.4.jar

    cli正常显示中文的hive-0.10.0

    官方版的hive,通过命令:desc table1,是不能正常显示中文注释的,附件是对源码改造过的hive-0.10.0可以通过命令:desc table1 正常显示中文注释

    hive所有jar文件

    用于Hive和HBase的连接,通过hive操作hbase上的表 解压缩后全部放入hive/lib下,需先删除原有jar

    大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南

    Hive CLI 和 Beeline 命令行的基本使用 Hive 常用 DDL 操作 Hive 分区表和分桶表 Hive 视图和索引 Hive 常用 DML 操作 Hive 数据查询详解 Spark、Storm、Flink、HBase、Kafka、Zookeeper、Flume、Sqoop等技术的学习

    非常好的大数据入门目资源,分享出来.zip

    Hive CLI 和 Beeline 命令行的基本使用 Hive 常用 DDL 操作 Hive 分区表和分桶表 Hive 视图和索引 Hive 常用 DML 操作 Hive 数据查询详解 三、Spark Spark Core : Spark 简介 Spark 开发环境搭建 弹性式数据集 RDD ...

    大数据精选入门指南,包括大数据学习路线、大数据技术栈思维导图

    Hive CLI 和 Beeline 命令行的基本使用 Hive 使用 DDL 操作 Hive 分区表和分区表 Hive 视图和索引 Hive 使用 DML 操作 Hive数据详细查询解 三、火花 火花核心: 斯帕克简介 Spark开发环境搭建 弹性式数据集 RDD RDD...

    全国职业技能大赛大数据赛项十套赛题(shtd)

    使用Scala编写spark工程代码,将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_...使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至对应报告中;

    Hadoop实战手册

    使用Mysql构建简单数据集市29#Mysql的两种引擎介绍29#创建一个数据表使用Hive cli 进行数据分析29#使用shell 编写Hsql 并使用HiveCli导出数据,使用Mysql命令加载到数据库中。29#使用crontab 新增每日运行任务定时器...

    hive常用函数参考手册.docx

    HIVE函数分类,HIVE CLI命令,简单函数,聚合函数,集合函数,特殊函数,常用函数Demo

    第4章 Hive参数配置与函数、运算符使用1

    第4章 Hive参数配置与函数、运算符使用Hive参数配置CLIs and Commands客户端和命令Hive CLI$HIVE_HOME/bin/hive是

    hive-quick-start:Hive快速入门指南

    蜂巢 概念: 数据库或架构:定义一组表 ... 对于开发实例来说,这应该足够了,但是在某些情况下,我们将希望同时运行hive CLI,元存储甚至hiveserver2,为了做到这一点,我们将需要一个实际保留信息的数据库。 为

    HiveUDTF:此Hive UDTF将复制第一个输入列

    在Hive CLI中,创建测试表: create table testudtf (a string, b string) ROW FORMAT DELIMITED FIELDS TERMINATED BY " , " ; 将下面的数据放在上面的Hive表中: echo " abc,xyz " > test.csv ##C。 测试...

    hive-udf:Simply Measured的Hive用户定义函数集合

    蜂巢Simply Measured的Hive用户定义函数集合用法通过Hive的auxjars功能,或通过Hive CLI中的ADD JAR命令,将其包含在Hive类路径中。 查询离开!职能 iso8601_to_unix_timestamp(String) - Convert an ISO 8601 ...

    HiveUDF:蜂巢样本UDF

    准备一个带有示例数据的Hive表在Hive CLI中,创建测试表: CREATE TABLE testarray (col1 string, col2 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY " | " ;CREATE TABLE testarray2 (col1 array < string>...

    hadoop+hive+mapreduce的java例子

    hive提供了三种用户接口:CLI,JDBC/ODBC和 WebUI CLI,即Shell命令行 JDBC/ODBC 是 Hive 的Java,与使用传统数据库JDBC的方式类似 WebGUI是通过浏览器访问 Hive 本文主要介绍的就是第二种用户接口,直接进入正题。 ...

    Hive数据文件以及CLI操作命令

    附件包括一个数据文件(csv文件,包括92168条记录)和一个包含操作命令的txt文件,用于Hive的学习。 其中csv文件可以上传到HDFS构建测试数据,txt文件给出了相关的操作命令。

    解决show create table中文乱码问题的hive-exec.jar

    针对 hdp-22.4.3.0-227版中的hive1.2.1000的cli show create table乱码的替换jar包。

Global site tag (gtag.js) - Google Analytics