`
功夫小当家
  • 浏览: 183442 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hive 支持json格式的表

    博客分类:
  • hive
阅读更多

问题描述:数据是json格式存储的,需要创建一张hive表支持json格式

 

(1)低版本的hive创建json格式的表,需要add jar...,hive2.3.0版本默认支持json格式的表

 

(2)创建json格式的表需要建表语句加

ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
STORED AS TEXTFILE

 

完整sql如下:

CREATE EXTERNAL TABLE `test_json`(
字段 类型 ...)
PARTITIONED BY ( 分区..)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
STORED AS TEXTFILE
LOCATION '...';

 

(3)虽然hive2.3.0直接支持建json格式的表,也支持select *,但是select count(1) 操作时候会报错找不到org.apache.hive.hcatalog.data.JsonSerDe

解决办法:

在hive-site.xml中添加如下配置,重启hive后,恢复正常

<property>
<name>hive.aux.jars.path</name>
<!--根据自己的实际路径修改-->
<value>/home/hadoop/apache-hive-2.3.2-bin/hcatalog/share/hcatalog/hive-hcatalog-core-2.3.2.jar</value>
</property>

 

0
0
分享到:
评论

相关推荐

    hive支持json格式的数据.pdf

    。。。

    hive支持json格式的数据.docx

    。。。

    Hive-JSON-Serde:读取-为Apache Hive编写JSON SerDe

    该库使Apache Hive能够以JSON格式进行读写。 它包括对序列化和反序列化(SerDe)以及JSON转换UDF的支持。 特征 读取以JSON格式存储的数据 在INSERT INTO 期间将数据转换为JSON格式 支持JSON数组和映射 支持嵌套数据...

    json-serde-1.3.8-jar-with-dependencies.jar

    hive json数据格式存储,支持数组和嵌套复杂数据结构解析

    mongo-hive:将您的 MongoDB 集合加载到 Hive 中。 支持复杂的JSON结构

    数组通常被拆分为不同的(子)Hive 表,与根表具有父/子关系。 这个怎么运作 连接到您的 MongoDB 并将指定的集合提取到本地文件中,然后将其复制到 HDFS。 MapReduce 生成模式(将副本保存回 MongoDB 以获取信息)...

    DataX数据的迁移(MySQL、HDFS,Hive)

    1.数据迁移的过程中,由于hive的Null值存储为"\N",Mysql存储为NULL值,二者转换时需要注意,再数据迁移json模板中,"nullFormat": "\\N", 该配置信息就是解决了数据迁移是存在的Null值。 2.如果hive中没有数值DataX...

    HiveSerde:Hive SerDe为复杂的儿子

    INSERT INTO表时将数据转换为JSON格式 支持数组和映射 还支持嵌套数据结构。 模块化以支持CD​​H的多个版本 编译 使用Maven编译Serde。 该项目使用maven配置文件来支持蜂巢/ CDH的多个版本。 要为CDH4构建: mvn...

    HiveSqlBloodFigure:hive血缘关系解析工具

    删除hive-exec与hadoop-common的maven依赖,使得项目更加的轻量级。 重构项目代码,优化解析,修复无字段血缘时,不能获取表血缘的BUG。 规范化接口输入输出,血缘图均为自定义实体,方便进行JSON序列化。 新增接口...

    json-array-1.0-SNAPSHOT.jar

    hive udf 支持数组字符串转数组对象

    homebridge-hive-plug:Hive SmartBridge用于HomeBridge

    此插件增加了对Hive智能插件的支持。 安装 1.安装HomeBridge 有关安装过程的详细信息,请参见 。 2.安装此插件 运行此命令以下载homebridge-hive-plug npm install -g homebridge-hive-plug 3.配置HomeBridge 在...

    DataGear数据可视化分析平台.rar

    2 支持多种格式的数据集支持创建SQL、CSV、Excel、HTTP接口、JSON数据集,可将数据集定义为动态参数化数据集,可添加文本框、下拉框、日期框、时间框等类型的数据集参数,为构建动态可交互图表提供支持 3 丰富强大...

    common-datax:基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步

    所以:提供通用数据抽取restful接口HDFS自动创库创表创分区利用freemarker模板自动创建json文件自动python执行job集成Azkaban进行调度管理例如:mysql到hive选择mysql需要同步的表、字段等信息,输入导入到hive的库...

    homebridge-bee-hive:用于Homebridge的超级基本Hive插件

    通过访问其GitHub页面开始使用安装npm install -g homebridge-bee-hive 然后,您需要修改config.json文件以包含以下内容...注册灯泡" accessories " : [{ " accessory " : " HomebridgeBeeHive " , " product " : ...

    ApacheHive

    存储:Hive底层存储依赖于hdfs,因此也支持hdfs所支持的数据存储格式,如text、json、parquet等。当我们将一个文件映射为Hive中一张表时,只需在建表的时告诉Hive,数据中的列名、列分隔符、行分隔符等,Hive就可以...

    bigdata-profiler:分析数据,验证模式并运行数据质量检查并生成报告

    大数据分析器 ... JSON格式 木地板 可以轻松扩展为Apache Spark支持读取的所有格式。 SQL支持自定义数据质量检查 同时支持ANSI-SQL和Hive QL。 可在找到所有受支持SQL函数的列表 内容 Datavalidator

    tutorials:StreamSet教程

    提取-从本地CSV格式的文件中读取记录,屏蔽PII(信用卡号),并将它们发送到Azure Data Lake Store中的JSON格式的文件中。 -集成, ,Azure Blob存储支持的Azure 和Apache Hive。StreamSets数据收集器-编

    Spark学习笔记(三):Spark DataFrame

    Spark SQL增加了DataFrame(即带有Schema信息的RDD),使用户可以在Spark SQL中执行SQL语句,数据既可以来自RDD,也可以是Hive、HDFS、Cassandra等外部数据源,还可以是JSON格式的数据 Spark SQL目前支持Scala、...

    支付宝

    Steem和Steem-engine的支持将来可能会被弃用。 该项目具有最少的错误检查。 假定您知道自己在做什么。 用法 node index.js token_config.json amttoairdrop [activekey] 不使用activekey:打印空投分发时间表。 ...

    PB_WinCE.rar_Platform Builder 5_platform builder_wince fat_windo

    使用platform builder开发wince嵌入式系统指导,内容包括: 使用Platform Builder配置Windows CE操作系统 3 引言 3 1 建立配置Windows CE的软硬件环境 3 2 Platform Builder 3.0...下面讲述如何设置基于HIVE的注册表 32

    java 连接spark工具类

    资源是java连接spark的源码,里面有支持连接hive,spark的方法,内部有两个方法,一个是getMaps,获取一个List对象,用于直接使用,一个是getJson,将获取到的数据转换成json,方便好用,不想下载的可以去我的博客去...

Global site tag (gtag.js) - Google Analytics