利用udf函数将hive统计结果直接插入到mysql - Tree - ITeye博客

`

翻滚吧--少年

浏览: 25064 次
性别:
来自: 杭州

最近访客更多访客>>

clannadas1413

whzxxyf

zhaoliuchuan

一语成谶

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

zhuchao_ko： 1、累2、坑
如何解决java工程中多个版本的包冲突问题
diwi： mysqldump --opt database | mysq ...
windows下通过Runtime.getRuntime().exec.()执行linuxshell脚本
leton2008：这个代码你最好格式化一下 int j = 1; boolea ...
关于DB2 jdbc连接数据库，ResultSet自动关闭猜想

利用udf函数将hive统计结果直接插入到mysql

博客分类：

Hive

阅读更多

大部分利用hive做数据分析的步骤是先用hive将统计结果导出到本地文件或者Hive的其他表中，再将本地文件导入到mysql或者利用sqoop将Hive表导入到mysql中。

今天同事给推荐了一个利用udf函数直接将统计结果导入mysql的方法。

步骤为

hive>add jar /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar;

Added /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar to class path
Added resource: /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar

hive>add jar /usr/share/java/mysql-connector-java-5.1.17.jar;

Added /usr/share/java/mysql-connector-java-5.1.17.jar to class path
Added resource: /usr/share/java/mysql-connector-java-5.1.17.jar

hive>CREATE TEMPORARY FUNCTION dboutput AS 'org.apache.hadoop.hive.contrib.genericudf.example.GenericUDFDBOutput';

hive>select dboutput('jdbc:mysql://localhost/result','root','123456','INSERT INTO dc(code,size) VALUES (?,?)',code,size) from accesslog limit 10;

注：result为mysql数据库名，dc为数据库result中的表名 dc(code,size)括号中的字段为mysql表dc字段，values(?,?)对应hive统计结果的值后面的code,size为hive表中的字段，accesslog表示hive中的表名称。

通过以上步骤即可将hive统计结果直接导入到mysql数据库中。

摘自：http://blog.csdn.net/jiedushi/article/details/8609019

分享到：

Mysql数据库备份 | linux nohup命令详解

2014-06-12 15:21
浏览 1224
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

实际开发应用实例，包含读取hive，MySQL，文件三种方式的数据交互: 包含读取hive，MySQL，文件三种方式的数据交互的udf函数，适用初高及数据研发人员在开发udf函数是作为参考，包括文件写入及读取方式，MySQL，hive等数据库连接可以直接将获取数据转为对象，便于后期开发达到复用目的...

【63课时完整版】大数据实践HIVE详解及实战: 29.Sqoop将MySQL数据导入到HDFS（一） 30.Sqoop将MySQL数据导入到HDFS（二） 31.Sqoop中的增量导入与Sqoop job 32.Sqoop将MySQL数据导入Hive表中 33.Sqoop的导出及脚本中使用的方式 34.案例分析-动态分区的实现 35....

分布式数据仓库Hive大全: 6. HIVE UDF 33 6.1 基本函数 33 6.1.1 关系操作符 33 6.1.2 代数操作符 34 6.1.3 逻辑操作符 35 6.1.4 复杂类型操作符 35 6.1.5 内建函数 36 6.1.6 数学函数 36 6.1.7 集合函数 36 6.1.8 类型转换 36 6.1.9 日期...

Hive用户指南: 6. HIVE UDF 33 6.1 基本函数 33 6.1.1 关系操作符 33 6.1.2 代数操作符 34 6.1.3 逻辑操作符 35 6.1.4 复杂类型操作符 35 6.1.5 内建函数 36 6.1.6 数学函数 36 6.1.7 集合函数 36 6.1.8 类型转换 36 6.1.9 日期...

大数据之运维.pptx: Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型，Hive 将用户的HiveQL 语句通过解释器转换为MapReduce 作业提交到Hadoop 集群上，Hadoop 监控作业执行过程，然后返回作业执行结果给用户。Hive 并非为...

Hadoop硬实战 [（美）霍姆斯著][电子工业出版社][2015.01]_PDF电子书下载带书签目录高清完整版.rar ): 技术点9　使用Sqoop 将数据导入MySQL 2．3．3　Hbase 技术点10　将数据从HDFS 导入HBase 技术点11　使用HBase 作为MapReduce 的数据接收器 2．4　本章小结 3　数据序列化――处理文本文件及其他格式的文件 3．1　...

Hadoop实战(第2版): 2．2．4　HBase 技术点6　HBase 导入HDFS 技术点7　将HBase 作为MapReduce 的数据源2．3　将数据导出Hadoop 2．3．1　将数据导入本地文件系统技术点8　自动复制HDFS 中的文件2．3．2　数据库技术点9　使用Sqoop 将...

Linkis:Linkis帮助轻松连接到各种后端计算存储引擎（Spark，Python，TiDB ...），公开各种接口（REST，JDBC，Java ...），并具有多租户，高性能和资源控制: 通过使用由Linkis提供的REST / WS / JDBC之类的标准接口，上层应用程序可以轻松访问诸如MySQL / Spark / Hive / Presto / Flink等底层引擎，并实现用户资源（如统一变量）的互通，脚本，UDF，函数和资源文件同时...

Spark分布式内存计算框架视频教程: 10.自定义函数UDF 11.分布式SQL引擎（spakr-sql和Spark ThriftServer） 12.Catalyst 优化器第四章、离线综合实战 1.综合实战概述（需求、调研、业务） 2.环境搭建（大数据环境和应用开发环境） 3.项目初始化（工具...

尚gg大数据项目实战电商数仓系统开发教程.txt: 62_用户行为数仓_自定义UDF函数（解析公共字段）.avi7 Q/ i) X8 O6 S0 M( V' m- ]- M 63_用户行为数仓_自定义UDTF函数（解析事件日志基础明细表）.avi 64_用户行为数仓_DWD层数据解析脚本.avi 65_用户行为数仓_DWD层...

Global site tag (gtag.js) - Google Analytics