sqoop 1.4.4 使用2 - - ITeye博客

`

tobyqiu

浏览: 40874 次
性别:
来自: 上海

最近访客更多访客>>

lvtt

caodaoxi

zcw3895653

nalnait

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

xjl456852：你好,我在执行job时出错了,不知道什么原因,请问这是什么情况 ...
Sqoop 1.99.3 with hadoop-2.3.0 使用 2

sqoop 1.4.4 使用2

博客分类：

hadoop sqoop hive

阅读更多

如果数据库类型是 date类型的就比较麻烦了，直接搞进hive 不行，因为hive只有timestamp，而去format还是 yyyy-mm-dd hh:mm:ss的

有2个办法，先导入临时表，临时表是string的类型（String的format是 yyyy-mm-dd），然后再往正式表里插

insert overwrite table adventureworksdw.dimdate
select * from adventureworksdw.dimdate2;

我使用第二种办法，query 导入

import 
--connect 
jdbc:mysql://prchaz02823:3306/adventureworksdw2008r2 
--username 
root   
--password  
root 
#--table  
#DimDate2  
--query
	'SELECT  DateKey,cast(FullDateAlternateKey as datetime) FullDateAlternateKey ,DayNumberOfWeek,EnglishDayNameOfWeek,DayNumberOfMonth,DayNumberOfYear,WeekNumberOfYear,EnglishMonthName,monthNumberOfYear,CalendarQuarter,CalendarYear ,CalendarSemester,FiscalQuarter,FiscalYear,FiscalSemester  frOM DimDate2 WHERE $CONDITIONS'
--split-by
DateKey
--null-string 
'\\N' 
--null-non-string 
'\\N'
--split-by  
DateKey 
--target-dir 
/home/dimdate_txt
--hive-import 
--hive-table 
adventureworksdw.dimdate2   
--map-column-hive
FullDateAlternateKey=timestamp
--hive-overwrite 
#--direct

把 date类型的FullDateAlternateKey 强制转换成datetime（主要是为了yyyy-mm-dd hh:mm:ss这个format），然后指定--split-by

这样在hive 中就不需要中间表了

我这里使用的中间目录，

--target-dir 
/home/dimdate_txt

否则会跑到默认的目录去，这个目录肯定是会生成的。

在你跑下一次的时候，会报错该目录已经存在，可以有2种办法一是删掉目录，二是使用append 好像.

分享到：

Hive 的join | sqoop 1.4.4 使用1

2014-03-26 15:19
浏览 1071
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

sqoop 1.4.4: 在压缩包文件名“sqoop-1.4.4.bin__hadoop-2.0.4-alpha”中，我们可以看出这是Sqoop 1.4.4的二进制发行版，特别为Hadoop 2.0.4-alpha这个早期的Hadoop 2.x版本做了优化。这个二进制包包含了所有必要的文件和脚本，...

sqoop-1.4.4-cdh5.0.6.tar: 2. **Sqoop 1.4.4 版本特点**： - 支持多种数据库：包括 MySQL, PostgreSQL, Oracle, SQL Server 等。 - 改进了性能和稳定性：相比早期版本，1.4.4 在并发性和错误处理方面有所优化。 - 增强的连接器：提供了更多...

Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册（All）_ZCX: 叶梓老师整理的Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册，非常实用

sqoop资源 sqoop-1.4.4.bin-hadoop-2.0.4- gz文件: 版本号“1.4.4”说明了这是sqoop工具的一个特定版本，而“bin-hadoop-2.0.4”则表示这个版本是专为与Hadoop 2.0.4版本兼容的二进制发布版本。由于Hadoop有多个版本，不同版本之间的兼容性可能会有所不同，因此指定...

sqoop-1.4.4-cdh5.1.0.tar: sqoop-1.4.4-cdh5.1.0.tar

zookeeper3.4.12+hbase1.4.4+sqoop1.4.7+kafka2.10: 在构建大数据处理环境时，Hadoop集群是核心基础，而`zookeeper3.4.12+hbase1.4.4+sqoop1.4.7+kafka2.10`这一组合则提供了集群中不可或缺的组件。让我们逐一探讨这些组件的功能、作用以及它们之间的协同工作。 **...

sqoop-1.4.6-cdh5.5.0.tar.gz: 在本篇中，我们将深入探讨 Sqoop 1.4.6 版本在 Cloudera Distribution Including Hadoop（CDH）5.5.0 平台上的具体应用及使用细节。首先，Sqoop 1.4.6 是该工具的一个稳定版本，它包含了多项改进和优化，比如增强...

第9章 Sqoop组件安装配置.docx: 在 Master 节点上使用 root 用户将 Sqoop 安装包解压到 /usr/local/src 目录下。 `[root@master ~]# cd /usr/local/src/` `[root@master src]# mv ./sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz .` ### 1.4.2. 实验任务...

sqoop安装手册: 在这个例子中，使用的版本是 sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz。你可以通过 SCP 命令将安装包上传到服务器，并使用 SSH 登录到服务器进行解压。解压后，为了方便管理，通常会重命名目录，例如这里将其...

sqoop 从 hive 导到mysql遇到的问题.docx: 例如，在描述文件中，Sqoop 的版本为 1.4.4，Hadoop 的版本为 1.0.0，Hive 的版本为 0.11.0。 Sqoop 在连接 MySQL 时，需要指定 JDBC 连接器的路径，否则 Sqoop 将无法连接到 MySQL 数据库。 5.Sqoop 的优点和缺点 ...

Hadoop2.2.0Hbase0.98.1Hive0.13完全安装手册: ### Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13 完全安装手册 #### 前言随着大数据技术的发展，Hadoop已经成为处理海量数据的核心框架之一。本文旨在为读者提供一套最新的Hadoop2.2.0、HBase0.98.1、...

hadoop生态系统搭建: 软件版本列表包括了搭建Hadoop生态系统所需的关键组件版本，例如JDK 1.7.0_67、MySQL 5.1、Hadoop 2.3.0、HBase 0.96、Hive 0.12、SolrCloud 4.4、Storm 0.92、Kafka 2.8.0、Flume-ng 1.4.0、Sqoop 1.4.4等。...

sqoop-server：정대학생정정가이드: Sqoop服务器 :male_sign: 个人资料이름오승재임찬기 역할 리드 개발자 Github :gear: 依赖模块 " dependencies " : { " aws-sdk " : " ^2.817.0 " , " clean-css " : " ~4.1.11 " , " constantinople " : " ~3.1.1 ...

Hadoop权威指南第二版(中文版): 　1.4.4 类型　模式　函数　用户自定义函数　过滤UDF 　计算UDF 　加载UDF 　数据处理操作　加载和存储数据　过滤数据　分组与连接数据　对数据进行排序　组合和分割数据　Pig实战　并行处理　参数代换 ...

Hadoop权威指南（中文版）2015上传.rar: 1.4.4 类型模式函数用户自定义函数过滤UDF 计算UDF 加载UDF 数据处理操作加载和存储数据过滤数据分组与连接数据对数据进行排序组合和分割数据 Pig实战并行处理参数代换第12章 Hive 1.1 安装Hive 1.1.1 ...

oozie 4.0.1 hadoop2.3.0 安装: - 将 `<sqoop.version>` 设置为你想要的版本，如1.4.4。 ##### 4. 编译Oozie - 执行命令 `mvn clean package assembly:single -DskipTests` 来编译Oozie。如果遇到网络问题导致编译中断，可以尝试多次执行此命令...

Global site tag (gtag.js) - Google Analytics