•创建数据文件test_partition_table.txt
•创建表
•create table test_partition_table (key string) partitioned by (dt string)
•加载数据
•LOAD DATA INPATH ‘filepath’ INTO TABLE test_partition_table partition (dt=‘2006’)
•查看数据
•select * from test_partition_table
•select count(*) from test_partition_table
•删除表 drop table test_partition_table
外部表
•指向已经在 HDFS 中存在的数据,可以创建 Partition
•它和 内部表 在元数据的组织上是相同的,而实际数据的存储则有较大的差异
•内部表 的创建过程和数据加载过程(这两个过程可以在同一个语句中完成),在加载数据的过程中,实际数据会被移动到数据仓库目录中;之后对数据对访问将会直接在数据仓库目录中完成。删除表时,表中的数据和元数据将会被同时删除
• 外部表 只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建立一个链接。当删除一个 外部表 时,仅删除该链接
外部表简单示例
•创建数据文件test_external_table.txt
•创建表
•create external table test_external_table (key string)
•加载数据
•LOAD DATA INPATH ‘filepath’ INTO TABLE test_inner_table
•查看数据
•select * from test_external_table
•select count(*) from test_external_table
•删除表 drop table test_external_table
Bucket Table
•可以将表的列通过Hash算法进一步分解成不同的文件存储
•例如:将age列分散成20个文件,首先要对AGE进行Hash计算,对应为0的写入/warehouse/test/date=20120801/postion=zh/part-00000,对应为1的写入/warehouse/test/date=20120801/postion=zh/part-00001
•如果想应用很多的Map任务这样是不错的选择
Bucket Table简单示例
•创建数据文件test_bucket_table.txt
•创建表
•create table test_bucket_table (key string)
clustered by (key) into 20 buckets
•加载数据
•LOAD DATA INPATH ‘filepath’ INTO TABLE test_bucket_table
•查看数据
•select * from test_bucket_table
•set hive.enforce.bucketing = true;
Hive的数据模型-视图
•视图与传统数据库的视图类似
•视图是只读的
•视图基于的基本表,如果改变,指增加不会影响视图的呈现;如果删除,会出现问题
•如果不指定视图的列,会根据select语句后的生成
•示例
•create view test_view as select * from test
第七部分:HiveUI介绍
启动UI
•配置
•hive-site.xml 添加
<property>
<name>hive.hwi.war.file</name>
<value>lib/hive-hwi-0.8.1.war</value>
</property>
•
•启动Hive的UI sh $HIVE_HOME/bin/hive --service hwi
相关推荐
【深入浅出 Hive】 Hive 是一款基于 Hadoop 的数据仓库工具,它的主要目标是提供对大规模分布式存储在 HDFS 上的数据集进行便捷的查询和分析能力。Hive 提供了类 SQL 的查询语言——HiveQL(HQL),使得熟悉 SQL 的...
《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一分布式计算框架的原理、架构及其应用。源代码作为书中的实践部分,对于理解和掌握Hadoop技术至关重要。这里,我们将从提供的源...
《完整指南:开源大数据栈》不仅涵盖了当前最流行的大数据处理技术和工具,还深入浅出地解析了这些技术的应用场景和最佳实践。无论是初学者还是经验丰富的专业人士都能从中获益匪浅。本书为读者提供了一个全面理解并...
虚拟化在航空企业领域应用解决方案.doc
电大程序设计形成性考核答案.doc
网络管理员日常必做的项工作.doc
系统集成工程安全生产规程.doc
【目标检测】轮胎破损裂纹检测数据集1871张YOLO+VOC(已增强).docx
第二章内容总结(1).pdf
计算机产业科技开发与服务项目创业计划书.doc
【目标检测】导弹数据集9871张YOLO+VOC格式(已增强).docx
电子商务管理课程实验指导书.doc
微信自定义表情包导出功能,python
计算机应用基础专升本答案.doc
轨道交通自动化工程BAS系统设计方案.docx
电子商务创业计划书网上衣城.doc
月计算机等级考试笔试试题及答案.docx
计算机考试题模拟精华版.doc
计算机等级考试二级MSOffice基础知识.doc
第五版项目管理过程组与知识领域表格.doc