Hadoop组件之-Sqoop -

reb12345reb

浏览: 47653 次
性别:
来自: 杭州

最近访客更多访客>>

longlongkong

sfyinian

chenquanyi

ycs123456

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop组件之-Sqoop

博客分类：

Hadoop

前置条件

已经成功安装配置Hadoop和Mysql数据库服务器，如果将数据导入或从Hbase导出，还应该已经成功安装配置Hbase。

下载sqoop和Mysql的JDBC驱动

sqoop-1.2.0-CDH3B4.tar.gz ：http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

mysql-connector-java-5.1.28

安装sqoop

[hadoop@appserver ~]$ tar -zxvf sqoop-1.2.0-CDH3B4.tar.gz

配置环境变量

拷贝Hadoop核心包和MYSQL驱动包到sqoop的lib目录

[hadoop@appserver ~]$ cp hadoop-1.1.2/hadoop-core-1.1.2.jar sqoop-1.2.0-CDH3B4/lib/

[hadoop@appserver ~]$ cp mysql-connector-java-5.1.28-bin.jar sqoop-1.2.0-CDH3B4/lib/

配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

注释掉hbase和zookeeper检查（除非准备使用HABASE等HADOOP组件）

启动hadoop集群

启动mysql

创建sqoop用户

建立sqoop库，test表，并构造测试数据

测试sqoop连接

[hadoop@appserver ~]$ sqoop list-databases --connect jdbc:mysql://10.120.10.11:3306/ --username sqoop --password sqoop

列出mysql中所有数据库的名称

从mysql导入到hdfs中

sqoop ##sqoop命令

import ##表示导入

--connect jdbc:mysql://ip:3306/sqoop ##告诉jdbc，连接mysql的url

--username sqoop ##连接mysql的用户名

--password sqoop ##连接mysql的密码

--table test ##从mysql导出的表名称

--fields-terminated-by '\t' ##指定输出文件中的行的字段分隔符

-m 1 ##复制过程使用1个map作业

[hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --fields-terminated-by ':' -m 1

Hadoop中查看导入结果

从hdfs导出到mysql中

sqoop

export ##表示数据从hive复制到mysql中

--connect jdbc:mysql://ip:3306/sqoop

--username sqoop

--password sqoop

--table test ##mysql中的表，即将被导入的表名称

--export-dir '/user/root/aa/part-m-00000' ##hive中被导出的文件

--fields-terminated-by '\t' ##hive中被导出的文件字段的分隔符

[hadoop@appserver ~]$ sqoop export --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --export-dir '/user/hadoop/test/part-m-00000' --fields-terminated-by ':' -m 1

Mysql中查看导出结果

从Mysql导入到Hbase中

参数说明：

Ø hbase_tablename指定要导成hbase的表名

Ø key_col_name指定mysql数据库表中哪一列作为hbase新表的rowkey

Ø col_fam_name是除rowkey之外的所有列的列族名

[hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --hbase-create-table --hbase-table mysql_sqoop_test --column-family info --hbase-row-key id -m 1

在Hbase中查看结果

分享到：

Hadoop组件之-MapReduce(InputFormat) | Hadoop组件之-Kafka

2015-12-07 17:33
浏览 825
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop组件之-Sqoop

前置条件

下载sqoop和Mysql的JDBC驱动

安装sqoop

配置环境变量

拷贝Hadoop核心包和MYSQL驱动包到sqoop的lib目录

配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

启动hadoop集群

启动mysql

创建sqoop用户

建立sqoop库，test表，并构造测试数据

测试sqoop连接

从mysql导入到hdfs中

从hdfs导出到mysql中

从Mysql导入到Hbase中

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop组件之-Sqoop

前置条件

下载sqoop和Mysql的JDBC驱动

安装sqoop

配置环境变量

拷贝Hadoop核心包和MYSQL驱动包到sqoop的lib目录

配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

启动hadoop集群

启动mysql

创建sqoop用户

建立sqoop库，test表，并构造测试数据

测试sqoop连接

从mysql导入到hdfs中

从hdfs导出到mysql中

从Mysql导入到Hbase中

评论

发表评论

相关推荐

Hadoop组件之-HIVE(位图索引)

Hadoop组件之-HDFS(HA实现细节)

Hadoop组件之-HDFS(FederationAndHA)

Spark-SQL简介

Python-With...As语法

Linux-RPM详解

Linux-NTP服务配置

Hadoop组件之-MapReduce(InputFormat)

Hadoop组件之-Kafka

Hadoop企业级搭建之-Cloudera产品部署

Hadoop企业级搭建之-版本选择

Hadoop企业级搭建之-组网设计方案理解

Hadoop企业级搭建之-组网设计(收敛比)

Hadoop企业级搭建之-组网设计(机架感知)

spark

map的环形内存缓冲区

MapReduce:详解Shuffle(copy,sort,merge)过程

最近访客更多访客>>